しんたろーのITアカデミー

しんたろーのITアカデミー

SNS運用・プログラミング・IT活用に関する情報を発信しています。

タグ: #End-to-End

すべての記事を表示
【速報】DeepMindがGemini 3.5を正式発表。音声翻訳の工程統合で開発者が注力すべき領域
·40 views·しんたろー

【速報】DeepMindがGemini 3.5を正式発表。音声翻訳の工程統合で開発者が注力すべき領域

70言語をリアルタイムで。音声AIの「つなぎ合わせ」が終わる日 DeepMindがGemini 3.5 Live Translateを発表した。 70種類以上の言語を、ほぼ遅延なしで相互に翻訳するモデルだ。 これまで音声認識・翻訳・音声合成を個別に構築していたパイプラインが過去のものになる。 End-to-Endのモデルが、人間の呼吸を読み、感情を乗せて別の言語で話し出す。

カテゴリから探す