Meta 開(kāi)發(fā) AI 語(yǔ)音助手,用于創(chuàng )建虛擬世界和實(shí)時(shí)翻譯
編譯 | 禾木木
出品 | AI科技大本營(yíng)(ID:rgznai100)
Meta 在近日的「用人工智能構建元宇宙」的討論會(huì )上,展示了最新的 AI 黑科技 「Builder Bot」 ,并且在此次會(huì )議上 Meta 公布了關(guān)于構建元宇宙的人工智能計劃,其中包括通用語(yǔ)言翻譯系統、對話(huà) AI 系統CAIRaoke,人工智能推薦系統 TorchRec 等。
Builder Bot
在此次討論會(huì )上,扎克伯格分享了他們正在研究一類(lèi)新的生成 AI 模型,該模型將允許人們描述一個(gè)世界,人工智能自動(dòng)生成它的各個(gè)方面。首次展示了用人工智能系統 Builder Bot 創(chuàng )建虛擬空間的過(guò)程。在元宇宙的島嶼上以 3D 化身的形式出現,并發(fā)出語(yǔ)音命令創(chuàng )建海灘等,該系統可以跟隨命令更改氣候,添加不同的場(chǎng)景。在這個(gè)世界里,你想要什么、去到哪里,只需要語(yǔ)音命令,就可以秒出。更有熱點(diǎn)的是,Builder Bot 還可以播放不同的音樂(lè )。
目前,Builder Bot 還在測試中,暫時(shí)還未開(kāi)放,因為 Meta 也還不確定它的限制在哪。在討論會(huì )上的另一部分是語(yǔ)音識別技術(shù),Meta 表示正在研究人工智能,讓人們能夠與語(yǔ)音助手進(jìn)行更自然的對話(huà)。
對話(huà) AI 系統CAIRaoke
在演示中,CAIRaoke 在一個(gè)家庭場(chǎng)景中起到了作用,人在煮菜時(shí),語(yǔ)音助手會(huì )發(fā)出提示,警告說(shuō)鹽已經(jīng)加到鍋里了。AI 助理還注意到鹽放少了,于是提示要加更多。在 Meta 發(fā)布的博客中,研究者們對 CAIRaoke 背后的技術(shù)進(jìn)行了解讀。CAIRaoke 減少了添加新域所需的工作。在規范方法中,擴展到新領(lǐng)域需要順序構建和更改每個(gè)模塊,然后才能可靠地訓練下一個(gè)模塊。此項技術(shù)提高了開(kāi)發(fā)和訓練速度,使我們能夠以更少的數據微調其他模型。該公司還表示,它已在旗下的視頻通話(huà)設備 Portal 中使用該模型,并期待將其集成到具有 AR 和 VR 的硬件設備中。
實(shí)時(shí)翻譯器
Meta 正在開(kāi)發(fā)一款通用語(yǔ)音翻譯器,旨在創(chuàng )建適用于「世界上所有語(yǔ)言」的翻譯軟件。該公司此前已為其人工智能系統設定了翻譯所有書(shū)面語(yǔ)言的目標。扎克伯格表示:“能夠用任何語(yǔ)言與任何人交流,這是人們夢(mèng)寐以求的超能力,而人工智能將在我們有生之年實(shí)現這一目標?!?/span>盡管當前的翻譯工具可以很好地適用于英語(yǔ)、普通話(huà)、西班牙語(yǔ)等常用語(yǔ)言,但世界上大約 20% 的人口不會(huì )說(shuō)這些系統所涵蓋的語(yǔ)言。通常,這些服務(wù)不足的語(yǔ)言沒(méi)有易于訪(fǎng)問(wèn)的書(shū)面文本語(yǔ)料庫,這些語(yǔ)料庫也是訓練 AI 系統必需的,甚至一些語(yǔ)言根本沒(méi)有標準化的書(shū)寫(xiě)系統。Meta 表示,它希望通過(guò)在兩個(gè)特定領(lǐng)域部署新的機器學(xué)習技術(shù)來(lái)克服這些挑戰。第一個(gè)稱(chēng)為 No Language Left Behind,將專(zhuān)注于構建可以使用更少的訓練示例學(xué)習翻譯語(yǔ)言的 AI 模型。第二個(gè)是通用語(yǔ)音翻譯器,旨在構建直接將語(yǔ)音從一種語(yǔ)言實(shí)時(shí)翻譯成另一種語(yǔ)言的系統,而無(wú)需書(shū)面組件作為中介(書(shū)面中介是許多翻譯應用程序的常用技術(shù))。Meta 正在構建一個(gè)新的高級 AI 模型,可以從更少的示例中進(jìn)行語(yǔ)言學(xué)習,Meta 將使用它來(lái)實(shí)現數百種語(yǔ)言的專(zhuān)家級翻譯,從阿斯圖里亞斯語(yǔ)、盧甘達語(yǔ)到烏爾都語(yǔ)。Meta 還在構建新型通用實(shí)時(shí)語(yǔ)音翻譯器,以支持沒(méi)有標準書(shū)寫(xiě)系統的語(yǔ)言及口頭語(yǔ)。為了支持低資源語(yǔ)言的翻譯,并為未來(lái)更多語(yǔ)言的翻譯創(chuàng )建構建塊,Meta 正在擴展自身的自動(dòng)數據集創(chuàng )建技術(shù)。一種是基于 LASER,一個(gè)是開(kāi)源工具包,現在包含用 28 種不同腳本編寫(xiě)的超過(guò)125種語(yǔ)言?;?LASER ,研究者構建了 ccMatrix 和 ccAligned 等系統,它們能夠在互聯(lián)網(wǎng)上查找不同語(yǔ)言的平行文本。由于低資源語(yǔ)言的可用數據很少,Meta 創(chuàng )建了一種新的訓練方法,使 LASER 能夠專(zhuān)注于特定的語(yǔ)言子組,例如班圖語(yǔ),并從更小的數據集中學(xué)習。這使得 LASER 能夠跨語(yǔ)言大規模有效地運行,最近還將 LASER 擴展到了語(yǔ)音處理領(lǐng)域。為了提升機器翻譯模型的性能,投入大量資源創(chuàng )建了大容量且可以高效訓練的模型。通過(guò)增加模型體量和自動(dòng)路徑學(xué)習功能,不同的符號可以使用不同的專(zhuān)家能力。為了將基于文本的機器翻譯模型擴展到上百種語(yǔ)言,Meta 提取了另一種語(yǔ)言為核心的多語(yǔ)言翻譯系統,其效果甚至優(yōu)于最好的雙語(yǔ)翻譯。在宣布這一消息的博客文章中,Meta 研究人員還沒(méi)有提供完成這些項目的時(shí)間表,也沒(méi)有提供實(shí)現目標的主要路線(xiàn)圖。相反,該公司只是強調了通用語(yǔ)言翻譯的可能性。Meta 還設想這種技術(shù)將極大造福于其遍布全球的產(chǎn)品,進(jìn)一步擴大其影響范圍并轉變?yōu)閿蛋偃f(wàn)人必不可少的通信工具。正如博客文章寫(xiě)到的那樣,通用翻譯軟件將成為未來(lái)可穿戴設備的殺手級應用,如 Meta 正在構建的 AR 眼鏡,還將打破沉浸式VR 和 AR 現實(shí)空間(Meta 也在構建)的界限。
結語(yǔ)
確實(shí),近年來(lái)機器學(xué)習的進(jìn)步大幅度地提高了機器翻譯的速度和準確性。從谷歌到蘋(píng)果,許多大型科技公司現在都在為用戶(hù)提供免費的人工智能翻譯工具,用于工作和旅游,無(wú)疑在全球范圍內都提供了不可估量的好處。但也會(huì )存在一些技術(shù)上的問(wèn)題,批評者指出機器翻譯會(huì )忽略在人類(lèi)說(shuō)話(huà)時(shí)的一些至關(guān)重要的細微差別,在輸出中會(huì )存在一些偏見(jiàn),并且指出只有計算機才能出現的一些奇怪的、意向不到的語(yǔ)法錯誤。對于使用非通用語(yǔ)言的人表示,如果翻譯完全由大型科技公司控制,他們擔心失去對自己語(yǔ)言和文化的掌握。盡管 Meta 長(cháng)期以來(lái)一直渴望進(jìn)入全球市場(chǎng),但該公司自己的產(chǎn)品仍然偏向于為其提供大部分收入的國家/地區。雖然通用翻譯器是一個(gè)非常美好的愿望,但 Meta 不僅需要證明它的技術(shù)和能力,作為一家公司,還需要公平地研究其應用。在此次討論會(huì )上,收獲的信息還是滿(mǎn)滿(mǎn)的,對此,你怎么看呢?參考鏈接:https://www.theverge.com/2022/2/23/22947368/meta-facebook-ai-universal-speech-translation-projecthttps://ai.facebook.com/blog/teaching-ai-to-translate-100s-of-spoken-and-written-languages-in-real-timehttps://www.reuters.com/technology/metaverse-event-metas-zuckerberg-unveils-work-improve-how-humans-chat-ai-2022-02-23/
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。