近日,Meta發布了一個名為SeamlessM4T的人工智能(AI)模型,可以翻譯和轉錄近百種語言。據Meta介紹,SeamlessM4T可以翻譯近100種語言的語音到文本和文本到文本。對于語音轉語音和文本轉語音的操作,它可以識別100種輸入語言,并將其轉換為35種輸出語言。
SeamlessM4T是根據知識共享許可(CC) 協議4.0發布的,允許研究人員對其進行迭代。

對于SeamlessM4T模型,Meta研究人員在一篇研究論文中表示,他們從400萬小時的原始音頻中收集了音頻訓練數據,這些音頻來自一個公開的抓取網絡數據存儲庫,但沒有說明是哪個存儲庫。Meta表示,SeamlessM4T代表了一個重大突破,因為這個模型可以一次性完成整個翻譯任務,而不像其他大型翻譯模型那樣,將翻譯分成不同的系。
SeamlessM4T建立在Meta之前的翻譯模型之上。Meta去年發布了支持200種語言的文本到文本的翻譯模型。它開發了用于多語言語音到語音翻譯的數據集,以及用于語音識別的大規模多語言語音。Meta去年展示了它的通用語音翻譯器,可將閩南語轉化為英語。
本文來自投稿,不代表科技訊立場,如若轉載,請注明出處:http://www.bdzhitong.com/article/577012.html