しんたろーのITアカデミー

しんたろーのITアカデミー

SNS運用・プログラミング・IT活用に関する情報を発信しています。

AIに「人間味」を教え込むのに3日かかった。Claude CodeでLINEをキャラ化する。
·120 views·しんたろー

AIに「人間味」を教え込むのに3日かかった。Claude CodeでLINEをキャラ化する。

※この記事は、Claude Codeで1人開発しているSNS運用SaaS「ThreadPost」の開発日記です。 キャラ崩壊との戦い 今週のコミットは26件だ。新機能が3件、バグ修正は0件だった。LINEの自動配信に「魂」を入れる作業に全振りした。システム自体は正常に動いている。でも、届くメッセージが機械的すぎた。だから、全53件のLINE通知をぽすたまキャラクターの口調に刷新した。

【保存版】LLMアプリの評価・テスト手法3選|品質担保ガイド
·112 views·しんたろー

【保存版】LLMアプリの評価・テスト手法3選|品質担保ガイド

LLMアプリを開発していて一番頭を悩ませるのが、出力品質の担保だ。同じプロンプトでも毎回回答がブレる。テストを自動化しようにも、従来のWebアプリの手法が全く通用しない。本番環境に出した途端、ハルシネーションや個人情報漏洩のリスクに怯えることになる。結論から言うと、LLMアプリには専用の設計と評価基盤が不可欠だ。

OpenAIがResponses APIをアップデート。o4-miniとMCP連携でAIエージェント開発のアーキテクチャが変化
·144 views·しんたろー

OpenAIがResponses APIをアップデート。o4-miniとMCP連携でAIエージェント開発のアーキテクチャが変化

AIエージェント開発のアーキテクチャ変化 OpenAIがResponses APIに組み込みツールを追加した。 エージェント型アプリケーション構築のコア基盤となるアップデートだ。 Chat Completions APIによる単一モデルとの対話から開発の焦点が移っている。 複数モデルをルーティングする自律型エージェント構築が主流になりつつある。 数行のコードでAIが外部ツールを操作する。

AI開発はスマートじゃない。PWA対応で7回連続エラーを吐き出し、直しては壊れる無限ループに陥った絶望。
·152 views·しんたろー

AI開発はスマートじゃない。PWA対応で7回連続エラーを吐き出し、直しては壊れる無限ループに陥った絶望。

※この記事は、Claude Codeで1人開発しているSNS運用SaaS「ThreadPost」の開発日記です。 PWA対応で7回コミット、全部エラーだった PWA対応は「ライブラリ一つ入れれば終わる」作業のはずだった。 結果は7回コミットして成功率0%。Service Workerが死んで、manifest.jsonがブラウザごとに違うエラーを吐いて、AIは「仕様が複雑です」しか言わなかった。

カテゴリから探す