しんたろーのITアカデミー

しんたろーのITアカデミー

SNS運用・プログラミング・IT活用に関する情報を発信しています。

タグ: #SWE-bench

すべての記事を表示
なぜOpenAIは計算資源を10GWまで倍増させたのか。開発者が自社評価パイプラインを構築すべき理由
·53 views·しんたろー

なぜOpenAIは計算資源を10GWまで倍増させたのか。開発者が自社評価パイプラインを構築すべき理由

10GWという数字が突きつけるAI開発の物理的限界 10GW(ギガワット)。一般的な原発10基分、数百万世帯の電力を賄うエネルギー量だ。 AI開発の最前線では計算資源の拡張が続いている。2025年初頭の目標を1年余りで塗り替え、直近90日間で3GWものキャパシティが上積みされた。 巨大な脳が作られる裏側で、既存のベンチマークが崩壊している。

Claude Codeがセッション管理を強化。記憶保持でAI開発の無駄が消える理由
·56 views·しんたろー

Claude Codeがセッション管理を強化。記憶保持でAI開発の無駄が消える理由

AIが「毎朝記憶を消される」状態で働いていた AIエージェントにバグを直させると、同じ修正を繰り返す。 各リトライがステートレスだからだ。 ある検証では、170回のAI呼び出しのうち100回——59%——が同じ壁にぶつかるだけの無駄なリトライだった。 合計23時間のうち約13時間が「AIが同じ間違いを繰り返す時間」だ。 Claude Codeの最新アップデートは、この構造的な問題に対応している。

カテゴリから探す