
Meta 最近公布了 AI 翻譯套件 Seamless Communication,該套件由 4 款 AI 模型組成,可實(shí)現(xiàn)近百種語(yǔ)言輸入、同聲傳譯能力,并支持僅 2 秒延遲的翻譯。
Meta 表示,該 AI 套件能夠“精準(zhǔn)再現(xiàn)說(shuō)話(huà)者情緒”。其中,SeamlessM4T 模型可以在翻譯時(shí)自動(dòng)聯(lián)想可能的后文,加速翻譯過(guò)程。
另一款模型 Seamless Expressive 則可以解決傳統(tǒng) AI 翻譯無(wú)法抓住用戶(hù)語(yǔ)調(diào)、停頓、讀詞重輕度的問(wèn)題,保存用戶(hù)情緒、風(fēng)格、說(shuō)話(huà)速度、停頓和節(jié)奏,從而為翻譯內(nèi)容帶來(lái)更多“情感信息”。
Seamless Streaming 是同聲翻譯模型,主打 2 秒延遲的語(yǔ)音和文字翻譯,支持口譯、聽(tīng)寫(xiě)翻譯及自動(dòng)語(yǔ)音識(shí)別功能。而綜合模型 Seamless 則整合了上述三種語(yǔ)言模型,便于通用場(chǎng)景。
目前 Meta 已經(jīng)將示例視頻發(fā)布在 GitHub 以及 HuggingFace 網(wǎng)站上,感興趣的小伙伴們可以點(diǎn)此進(jìn)行查看。
原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請(qǐng)注明出處:http://www.bdzhitong.com/article/602032.html