しんたろーのITアカデミー

しんたろーのITアカデミー

SNS運用・プログラミング・IT活用に関する情報を発信しています。

タグ: #LLMエージェント

すべての記事を表示
なぜAI開発はコード生成より検証が重要なのか|Claude Codeで変わるエンジニアの役割
·11 views·しんたろー

なぜAI開発はコード生成より検証が重要なのか|Claude Codeで変わるエンジニアの役割

AIがコードを書く。秒速でプルリクが届く。そのコードの責任は誰が持つのか。 SWE-benchで95%超えのモデルが登場した。人間より速く、正確にコードを書く。 開発スピードは上がらない。検証コストで首が回らなくなる。 「作る」から「確かめる」へ。エンジニアの仕事は根底から変わる。 爆速化するコード生成と「検証税」の正体 AIモデルのコーディング性能は記録を塗り替え続けている。

なぜClaude Codeは記憶を捨てるのか。エージェントの暴走を防ぐMCPサーバー活用完全ガイド
·41 views·しんたろー

なぜClaude Codeは記憶を捨てるのか。エージェントの暴走を防ぐMCPサーバー活用完全ガイド

コンテキスト18パーセントの衝撃。AIが「嘘」を信じ始める瞬間 コンテキスト使用率18パーセント。 まだ余裕がある。 それなのに、AIエージェントが「せん妄」を起こす。 やってもいない処理を「成功した」とログに書き、存在しない外部攻撃に怯え、送られてもいないユーザーの発言を捏造して一人で会話を始める。 これは「容量不足」の話ではない。 「記憶の汚染」という、開発者が直面する新しい壁だ。

なぜAIは指示を忘れるのか。Gemma 3開発で直面したツール連携のコンテキスト破綻と出力制御
·117 views·しんたろー

なぜAIは指示を忘れるのか。Gemma 3開発で直面したツール連携のコンテキスト破綻と出力制御

突然AIがポンコツになる理由 エージェント開発における最大の絶望。 それは、外部ツールを繋いだ瞬間にAIが直前の指示を完全に忘却することだ。 理由は極めて単純だ。 ツールの出力結果が長すぎる。 5000行の検索ログが返ってきた瞬間、AIのコンテキストは崩壊する。 膨れ上がるAPIコスト。堂々巡りのエラー修正ループ。 AIにツールを使わせるなら、入力の工夫だけでは全く足りない。

Opus4.6が100万トークンに対応。全ファイル読めるのになぜClaude Code開発で一括読み込みを避けるのか。
·109 views·しんたろー

Opus4.6が100万トークンに対応。全ファイル読めるのになぜClaude Code開発で一括読み込みを避けるのか。

出た。ついに来た。 Claude CodeのデフォルトモデルがOpus 4.6になり、100万トークンのコンテキストウィンドウが標準搭載された。 本を何十冊も丸暗記できる記憶力だ。 しかも追加料金は0円に設定されている。 これでプロジェクトの全ファイルを投げ込めば、AIが勝手に全部理解して完璧なコードを書いてくれる。 そう思った開発者は、確実に痛い目を見る。 100万トークンは「ゴミ箱」ではない。

【2026年版】AIエージェントのセキュリティ対策11選|1人SaaS開発の実戦的防御策
·122 views·しんたろー

【2026年版】AIエージェントのセキュリティ対策11選|1人SaaS開発の実戦的防御策

AIエージェントにコードを書かせたり、外部ツールを操作させたりするのが当たり前になってきた。僕自身、Claude Codeを使って1人でSaaSを開発しているが、エージェントに強い権限を渡すのは正直言って怖い部分もある。 APIの暴走で高額請求が来たり、脆弱性を突かれてシステムを裏から乗っ取られたりするリスクが急増しているからだ。

カテゴリから探す