Meta發(fā)布人工智能模型,支持幾十種語(yǔ)言語(yǔ)音互譯
8月23日消息,Facebook母公司Meta Platforms于周二發(fā)布了一款人工智能模型,能夠在數十種語(yǔ)言之間進(jìn)行語(yǔ)音翻譯和轉錄,為跨語(yǔ)言交流提供了潛在的基礎工具。
本文引用地址:http://dyxdggzs.com/article/202308/449862.htmMeta公司在一篇博客文章中表示,其SeamlessM4T模型可以支持近100種語(yǔ)言的文本和語(yǔ)音之間的翻譯,以及35種語(yǔ)言的語(yǔ)音互譯。該模型整合了之前只能在不同模型中使用的技術(shù)。
首席執行官馬克·扎克伯格(Mark Zuckerberg)曾表示,他設想這樣的工具可以促進(jìn)來(lái)自全球各地的用戶(hù)在元宇宙中進(jìn)行互動(dòng),元宇宙是他押注公司未來(lái)的一組相互連接的虛擬世界。
Meta稱(chēng),該模型對非商業(yè)用途的公眾開(kāi)放。
作為全球最大的社交媒體公司,Meta今年發(fā)布了一系列主要免費的人工智能模型,其中包括一個(gè)名為L(cháng)lama的大型語(yǔ)言模型,對微軟支持的OpenAI和谷歌旗下的Alphabet的專(zhuān)有模型帶來(lái)了巨大挑戰。扎克伯格表示,對Meta來(lái)說(shuō),開(kāi)放的人工智能生態(tài)系統更有利,因為公司通過(guò)有效地集思廣益地開(kāi)發(fā)面向社交平臺的消費者工具,比起收費訪(fǎng)問(wèn)模型,能獲得更多利益。
然而,Meta面臨與該行業(yè)其他公司相似的法律問(wèn)題,涉及用于訓練模型的數據來(lái)源。
今年7月,喜劇演員莎拉·西爾弗曼(Sarah Silverman)和其他兩位作者對Meta和OpenAI提起了侵權訴訟,指控這兩家公司未經(jīng)許可使用他們的書(shū)籍作為訓練數據。
對于SeamlessM4T模型,Meta的研究人員在一篇研究論文中表示,他們從400萬(wàn)小時(shí)的“來(lái)自公開(kāi)可用的網(wǎng)絡(luò )數據存儲庫的原始音頻”中收集了音頻訓練數據,但沒(méi)有具體說(shuō)明是哪個(gè)存儲庫。
Meta的發(fā)言人未回答關(guān)于音頻數據來(lái)源的問(wèn)題。
研究報告稱(chēng),文本數據則來(lái)自去年創(chuàng )建的數據集,這些數據集從維基百科和相關(guān)網(wǎng)站上抓取內容。
評論