·40 views·しんたろー
【速報】DeepMindがGemini 3.5を正式発表。音声翻訳の工程統合で開発者が注力すべき領域
70言語をリアルタイムで。音声AIの「つなぎ合わせ」が終わる日 DeepMindがGemini 3.5 Live Translateを発表した。 70種類以上の言語を、ほぼ遅延なしで相互に翻訳するモデルだ。 これまで音声認識・翻訳・音声合成を個別に構築していたパイプラインが過去のものになる。 End-to-Endのモデルが、人間の呼吸を読み、感情を乗せて別の言語で話し出す。