[ニューヨーク 22日 ロイター] - 米メタ・プラットフォームズは22日、数十カ国語の音声を翻訳・文字化できるAIモデル「SeamlessM4T」を発表した。ブログで明らかにした。
このモデルは約100言語の文字・音声に対応し、35言語では完全な音声対音声翻訳も可能という。
メタはこのモデルを非商用利用向けに一般公開する方針。
[ニューヨーク 22日 ロイター] - 米メタ・プラットフォームズは22日、数十カ国語の音声を翻訳・文字化できるAIモデル「SeamlessM4T」を発表した。ブログで明らかにした。
このモデルは約100言語の文字・音声に対応し、35言語では完全な音声対音声翻訳も可能という。
メタはこのモデルを非商用利用向けに一般公開する方針。
(c) Thomson Reuters 2024 All rights reserved.
台本を渡すとディープフェイクの動画と共にアバターが読み上げてくれるシンセシアの有料版も使ってみましたが、日本語がとても違和感がありました。
日本語をマスターした外国人の日本語をAIの学習材料に使っている感がありました。
メタのサービスも使ってみたいですね。
音声翻訳AIモデルとは、音声入力から他言語の音声に直接翻訳するのでしょうか?それとも大規模言語モデルの前後に音声認識モデルと音声合成モデルが統合されたということでしょうか?詳細が知りたいです。
マイニュースに代わり
フォローを今後利用しますか