ChatGPT現在可以開(kāi)口說(shuō)話(huà)了!直接威脅Siri等智能助手
9月26日消息,美國時(shí)間周一,OpenAI宣布給聊天機器人ChatGPT增加了語(yǔ)音交談的功能。這使得OpenAI與谷歌、蘋(píng)果、亞馬遜等科技巨頭在智能語(yǔ)音助手領(lǐng)域的競爭中直接對抗。
本文引用地址:http://dyxdggzs.com/article/202309/451001.htmChatGPT可以用五個(gè)“角色”來(lái)回答用戶(hù)的查詢(xún),與Alexa和Siri等語(yǔ)音助手相比,它的語(yǔ)氣聽(tīng)起來(lái)也更像真人。OpenAI表示,增加語(yǔ)音功能是吸引更多用戶(hù)使用ChatGPT并與其互動(dòng)的重要方式。
OpenAI負責消費產(chǎn)品的副總裁彼得·鄧(Peter Deng)接受采訪(fǎng)時(shí)表示:“這是我們面臨的挑戰,最難的一項工作就是將這項令人驚嘆的技術(shù)簡(jiǎn)化?!?/p>
OpenAI宣布為ChatGPT推出語(yǔ)音功能的同一天,亞馬遜宣布簽署一項協(xié)議,將向人工智能初創(chuàng )公司Anthropic投資最多40億美元。這是自今年初微軟對OpenAI投資以來(lái),人工智能領(lǐng)域規模最大的交易,表明科技巨頭正在將賭注押在熱門(mén)的人工智能初創(chuàng )企業(yè)上。
谷歌、亞馬遜和OpenAI等公司上周發(fā)布了幾款人工智能產(chǎn)品,以擊敗競爭對手。集成到現有音箱中是各公司讓用戶(hù)使用聊天機器人并付費的關(guān)鍵途徑之一。
亞馬遜宣布在A(yíng)lexa家庭音箱上添加聊天機器人“對話(huà)”功能,這些智能音箱已經(jīng)進(jìn)入數百萬(wàn)個(gè)美國家庭。而谷歌則表示正在考慮將聊天機器人Bard的技術(shù)應用到自己的語(yǔ)音助手中。
目前,人們可以在ChatGPT的移動(dòng)應用上大聲提問(wèn),但聊天機器人會(huì )以文本回答?,F在人們還可以將圖片作為問(wèn)題的一部分上傳給聊天機器人,比如展示冰箱里的食材照片,并要求聊天機器人給出食譜建議。
添加語(yǔ)音和圖像功能使得ChatGPT有望成為一個(gè)真正的“多模態(tài)”模型,它可以“看到”和“聽(tīng)到”世界,并能夠用語(yǔ)音和圖像進(jìn)行回應。多模態(tài)模型是該行業(yè)競爭的下一個(gè)階段,許多公司正在競相開(kāi)發(fā)功能更強大的模型。
多年來(lái),語(yǔ)音助手已經(jīng)出現在汽車(chē)、智能手機、電視和智能音箱中,每天有無(wú)數人使用。但在大多數情況下,語(yǔ)音助手只能進(jìn)行簡(jiǎn)單的互動(dòng),比如開(kāi)燈或報天氣等。聊天機器人背后的“大語(yǔ)言模型”技術(shù)開(kāi)啟了一種可能性,讓語(yǔ)音助手能夠進(jìn)行更長(cháng)、更自然的對話(huà),并回答更復雜的問(wèn)題。
投資者和分析師指責亞馬遜對聊天機器人和圖像生成器等生成式人工智能領(lǐng)域的競爭反應遲緩。Anthropic的投資將使亞馬遜接觸到這家初創(chuàng )公司的研究人員和技術(shù)。Anthropic由前OpenAI員工創(chuàng )立,之前曾接受過(guò)谷歌的投資。
市場(chǎng)研究公司Gartner副總裁吉姆·黑爾(Jim Hare)表示,亞馬遜通過(guò)上述舉措向市場(chǎng)展示了自己是生成式人工智能領(lǐng)域的積極參與者,并試圖改變人們對其已經(jīng)落后的印象。
OpenAI去年11月發(fā)布了ChatGPT,引發(fā)了聊天機器人的熱潮。微軟與OpenAI合作使用后者的技術(shù),谷歌則推出了自己的聊天機器人Bard。
人工智能研究人員警告稱(chēng),人們可能會(huì )過(guò)度擬人化聊天機器人,因為它們的回答通??雌饋?lái)很像真人的回應。這可能導致用戶(hù)錯誤地對機器人的智能或能力產(chǎn)生信任。然而,聊天機器人仍然常常編造信息,并將其偽裝成真實(shí)答案,這被人工智能研究人員稱(chēng)為“幻覺(jué)”。
ChatGPT的新角色名為Sky、Ember、Breeze、Juniper和Cove,每個(gè)角色都有不同的語(yǔ)調和口音?!癝ky”的聲音聽(tīng)起來(lái)有點(diǎn)像斯嘉麗·約翰遜(Scarlett Johansson),她在電影《她》中為主角愛(ài)上的人工智能配音。。OpenAI高管彼得·鄧表示,語(yǔ)音角色并不是為了讓人聽(tīng)起來(lái)像某個(gè)特定的人。
在一次演示中,彼得·鄧展示了機器人如何理解雜亂無(wú)章的開(kāi)放式語(yǔ)音問(wèn)題。他說(shuō),這些新功能使對話(huà)變得更容易、更自由,而不必考慮如何準確地表達一個(gè)問(wèn)題?!坝辛诉@個(gè)功能,你就可以與ChatGPT對話(huà)了,”鄧說(shuō)?!拔业暮⒆蝇F在要求用ChatGPT講睡前故事?!?/p>
OpenAI的政策研究員桑吉尼·阿加瓦爾(Sandhini Agarwal)在采訪(fǎng)中表示,他們已經(jīng)測試了語(yǔ)音和圖像功能,并增加了安全措施,以確保機器人對敏感話(huà)題作出適當的回應。例如,如果用戶(hù)詢(xún)問(wèn)與心理健康相關(guān)的問(wèn)題,ChatGPT會(huì )建議他們咨詢(xún)專(zhuān)業(yè)人士。不過(guò),阿加瓦爾表示還有更多工作要做,這項工作還遠未完成。
評論