しんたろーのITアカデミー

しんたろーのITアカデミー

SNS運用・プログラミング・IT活用に関する情報を発信しています。

タグ: #LLM最適化

すべての記事を表示
なぜGoogleはGemini 3.5 Flashで推論コストを削るのか。Claude Code開発者が読み解く効率化の次世代技術
·179 views·しんたろー

なぜGoogleはGemini 3.5 Flashで推論コストを削るのか。Claude Code開発者が読み解く効率化の次世代技術

異次元のコスト削減。開発者が直面する「推論の経済性」 AI開発の主戦場が変わった。 これまでは「どれだけ賢いか」が全てだった。 今は「どれだけ安く、速く、大量に回せるか」が問われる。 Googleが発表した Gemini 3.5 Flash。 推論コストは最大で 6倍 下がる。 100万トークン あたりの単価が変化した。 AIは「たまに使う便利な道具」から「24時間動き続けるインフラ」へ移行する。

Qwen3.5の4Bモデルが巨大AIを凌駕した理由。Claude Code開発者が注目する軽量化戦略
·64 views·しんたろー

Qwen3.5の4Bモデルが巨大AIを凌駕した理由。Claude Code開発者が注目する軽量化戦略

3.4GBのモデルが25GBのモデルに勝った。 function calling(ツール呼び出し)の精度で、Qwen3.5 4Bが97.5%を叩き出した。 巨大なモデルほど賢いという神話が、開発現場で音を立てて崩れている。 僕ら開発者は、モデルの巨大化ではなく「環境の最適化」を追う。 この逆転劇の裏側にある、AIエージェント開発の新しい常識を深掘りする。

CursorのBugbot努力レベル選択が開発を変える理由|コストと品質の最適化
·58 views·しんたろー

CursorのBugbot努力レベル選択が開発を変える理由|コストと品質の最適化

AIに「努力」を割り当てる。CursorのBugbotに「努力レベル」の設定が追加された。Defaultは効率重視、Highは推論重視。バグ発見数は0.7個から0.95個へ。この0.25個の差にコストを払う。開発は「単なる自動化」から「コストと品質の最適化」へ移行した。 AIエージェントの「努力」を制御する CursorのBugbotに、レビューの「熱量」を制御する機能が加わった。

Gemini Robotics-ER 1.6でロボットが指差し認識する仕組み|開発者が知るべき物理世界接続の完全ガイド
·89 views·しんたろー

Gemini Robotics-ER 1.6でロボットが指差し認識する仕組み|開発者が知るべき物理世界接続の完全ガイド

物理世界とデータ処理の壁 AIが画面の中から飛び出した。 ロボットが現実空間を理解し始めた。 これからの主戦場は物理世界との接続だ。 空間を認識し、計器を読み取り、瞬時に判断する。 それを支えるのは、データの前処理とメモリの圧縮技術だ。 次世代エージェント開発の勝敗はここで決まる。 ロボットが現実を理解するプロセスの全貌 AIが現実の空間を認識する能力が向上した。

なぜ自然な音声AI開発が急加速するのか。DeepMind公式Gemini 3.1 Flash Live完全ガイド
·156 views·しんたろー

なぜ自然な音声AI開発が急加速するのか。DeepMind公式Gemini 3.1 Flash Live完全ガイド

音声AIの常識が今、根本から覆る 音声AIの進化が次のフェーズに入った。 これまでは音声をテキストにしてからLLMに投げるのが当たり前だった。 その常識が今、根本から覆ろうとしている。 超低遅延で自然な対話を実現する最新の音声モデルが公開された。 既存の常識を打ち破る圧倒的精度の音声認識技術も登場した。 長時間の対話履歴を保持するためのメモリ圧縮アルゴリズムまで発表された。

カテゴリから探す