OpenAI上線(xiàn)ChatGPT高級語(yǔ)音模式,并發(fā)布包含14種語(yǔ)言的數據集
近日,OpenAI 在 AI 全球化進(jìn)程中邁出了重要一步。
該公司不僅上線(xiàn)了 ChatGPT 的高級語(yǔ)音模式(AVM,Advanced Voice Mode),還發(fā)布了一個(gè)包含 14 種語(yǔ)言的多語(yǔ)言數據集,用于評估語(yǔ)言模型的性能。
這兩項舉措都旨在提升 AI 技術(shù)的全球可及性和實(shí)用性。
OpenAI 宣布,將其 AVM 擴展到更多付費用戶(hù)。這一音頻功能使得用戶(hù)與 ChatGPT 的交流更加自然,初期將向 ChatGPT Plus 和 Teams 客戶(hù)推出。企業(yè)和教育客戶(hù)將于下周開(kāi)始獲得訪(fǎng)問(wèn)權限。
作為推廣的一部分,AVM 進(jìn)行了設計改版。目前,藍色的躍動(dòng)球體作為這項功能的顯示,取代了 OpenAI 在 5 月份展示該技術(shù)時(shí)所用的黑點(diǎn)。
如果對用戶(hù)開(kāi)放 AVM 功能,用戶(hù)會(huì )在 ChatGPT 應用程序中的語(yǔ)音圖標旁邊收到一個(gè)彈出窗口。
此外,ChatGPT 還新增了 5 個(gè)用戶(hù)可以嘗試的聲音,分別是:阿伯(Arbor)、梅普爾(Maple)、索爾(Sol)、斯普魯斯(Spruce)和維爾(Vale)。
在此基礎上,ChatGPT 的聲音種類(lèi)的總數已達到 9 個(gè),幾乎與谷歌的 Gemini Live 一樣多。
有意思的是,其命名的來(lái)源受到大自然的啟發(fā),這也許是因為想讓 ChatGPT 用起來(lái)感覺(jué)更親切。
值得注意的是,OpenAI 在春季更新時(shí)展示的“天空(Sky)”聲音并未出現在此次更新中。原因在于,著(zhù)名演員斯嘉麗·約翰遜(Scarlett Johansson)提出了反對。
約翰遜在電影《她》(Her)中扮演了一個(gè) AI 系統,她聲稱(chēng) Sky 的聲音與她自己的聲音太過(guò)相似。
作為回應,OpenAI 迅速下架了 Sky 的聲音,稱(chēng)其從未打算模仿約翰遜的聲音,盡管當時(shí)有幾名員工在推文中提到了這部電影。
(來(lái)源:OpenAI)
OpenAI 對媒體表示,從公布 AVM 的 alpha 測試起,他們已經(jīng)進(jìn)行了一系列改進(jìn)。
與此前相比,目前,ChatGPT 的語(yǔ)音功能對口音的理解力更佳,對話(huà)也更流暢、更快速。
此外,OpenAI 把 ChatGPT 的部分定制功能擴展到 AVM,例如允許用戶(hù)定制 ChatGPT 的回應方式。
然而,ChatGPT 的視頻和屏幕共享功能尚未在此次推廣中出現。該功能本應允許 GPT-4 同時(shí)處理視覺(jué)和聽(tīng)覺(jué)信息。目前,OpenAI 還沒(méi)有提供何時(shí)推出這些多模態(tài)功能的時(shí)間表。
除了高級語(yǔ)音模式,OpenAI 還在開(kāi)放數據平臺 Hugging Face 上發(fā)布了多語(yǔ)言大規模多任務(wù)語(yǔ)言理解(MMMLU,Multilingual Massive Multitask Language Understanding)數據集。
這個(gè)新的評估工具是在 MMLU 基準測試的基礎上發(fā)展而來(lái)。
MMLU 原本只針對英語(yǔ),測試 AI 系統在數學(xué)、法律和計算機科學(xué)等 57 個(gè)學(xué)科領(lǐng)域的知識。而新的 MMMLU 數據集則囊括了中文、阿拉伯語(yǔ)、德語(yǔ)和孟加拉語(yǔ)等 14 種語(yǔ)言。
通過(guò)將這些多樣化的語(yǔ)言納入新的多語(yǔ)言評估中,尤其是在其中一些語(yǔ)言的訓練數據資源有限的情況下,OpenAI 為多語(yǔ)言 AI 能力設立了新的基準。
這一基準測試可能會(huì )為該技術(shù)帶來(lái)更公平的全球訪(fǎng)問(wèn)機會(huì )。一直以來(lái),AI 行業(yè)因無(wú)法開(kāi)發(fā)出能理解全球數百萬(wàn)人使用的語(yǔ)言的語(yǔ)言模型而受到批評。
直到最近,AI 研究主要集中在英語(yǔ)和少數幾種廣泛使用的語(yǔ)言上,導致許多低資源語(yǔ)言被忽視。
OpenAI 決定將包括斯瓦希里語(yǔ)和約魯巴語(yǔ)在內的語(yǔ)言收錄其中,這些語(yǔ)言雖然使用者眾多,但在 AI 研究中經(jīng)常被忽視。這也標志著(zhù),AI 技術(shù)正朝著(zhù)更具包容性的方向發(fā)展。
為了確保 MMMLU 數據集的準確性,OpenAI 聘請了專(zhuān)業(yè)人工翻譯,這比依賴(lài)機器翻譯的同類(lèi)數據集更為精確,特別是在訓練資源較少的語(yǔ)言中。
通過(guò)依靠人類(lèi)的專(zhuān)業(yè)知識,OpenAI 確保該數據集為評估多語(yǔ)言 AI 模型提供了更可靠的基礎。
對于企業(yè)而言,MMMLU 數據集提供了在全球背景下對其自身 AI 系統進(jìn)行基準測試的機會(huì )。
隨著(zhù)公司向國際市場(chǎng)擴張,部署能夠理解多種語(yǔ)言的 AI 解決方案的能力變得至關(guān)重要。
無(wú)論是客戶(hù)服務(wù)、內容審核還是數據分析,在多種語(yǔ)言中表現良好的 AI 系統都可以通過(guò)減少溝通摩擦和改善用戶(hù)體驗,來(lái)提供競爭優(yōu)勢。
除了發(fā)布 MMMLU 數據集,OpenAI 還啟動(dòng)了 OpenAI 學(xué)院(OpenAI Academy)項目,以進(jìn)一步履行其對全球 AI 可及性的承諾。
(來(lái)源:OpenAI)
據介紹,該學(xué)院旨在投資開(kāi)發(fā)人員和以使命為導向的組織,這些組織正在利用 AI 來(lái)解決其社區中的關(guān)鍵問(wèn)題,特別是在低收入和中等收入國家。
學(xué)院將提供培訓、技術(shù)指導以及 100 萬(wàn)美元的應用程序編程接口(API,Application Programming Interface)信用點(diǎn),以確保當地 AI 人才能夠訪(fǎng)問(wèn)前沿資源。
通過(guò)支持了解其地區獨特社會(huì )和經(jīng)濟挑戰的開(kāi)發(fā)人員,OpenAI 希望賦予社區能力,以構建為當地需求量身定制的 AI 應用程序。
運營(yíng)/排版:何晨龍
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。