しんたろーのITアカデミー

しんたろーのITアカデミー

SNS運用・プログラミング・IT活用に関する情報を発信しています。

タグ: #強化学習

すべての記事を表示
Claude Codeの機能更新とAI開発の試行錯誤
·61 views·しんたろー

Claude Codeの機能更新とAI開発の試行錯誤

13パラメータでAIの数学性能が変化する AI開発の歴史が塗り替えられた。 わずか13個のパラメータ。容量にして26バイト。 この極小の更新で、言語モデルの数学性能が向上するデータが示された。 数百万のパラメータを更新する従来の手法とは異なるアプローチだ。 一方で、Claude Codeのような自律型ツールの進化も続く。 モデルを賢くする「微調整」と、AIを使い倒す「ワークフロー」。

OpenAIの推論モデルが数学の難問を突破した理由。AI開発者が今学ぶべき報酬設計の完全ガイド
·50 views·しんたろー

OpenAIの推論モデルが数学の難問を突破した理由。AI開発者が今学ぶべき報酬設計の完全ガイド

80年間、誰も解けなかった数学の難問がAIによって崩された。 1946年に数学者ポール・エルデシュが提唱した「平面内での単位距離問題」。 この80年近く数学者たちを悩ませてきた離散幾何学の難問が、AIによって解明された。 数学専用に特化して訓練されたモデルではない。 汎用的な推論能力を持つモデルが、自律的に証明を導き出した。 これは計算の高速化ではない。

OpenAIのParameter Golfから紐解く、開発者がコード執筆から評価設計へ移行するガイド
·81 views·しんたろー

OpenAIのParameter Golfから紐解く、開発者がコード執筆から評価設計へ移行するガイド

OpenAIが開催した Parameter Golf の結果が公開された。 16MB という極小のサイズ制限と、H100を8枚 使用し 10分 で学習を終えるという制約だ。 この極限状態で勝敗を分けたのは、人間が書くコードの美しさではない。 AIエージェントを使い倒し、試行錯誤を自動化したか が鍵となった。 開発者の主戦場は「コードを書くこと」から「AIの評価を設計すること」へ移行している。

カテゴリから探す