蘋(píng)果或推AI手機?論文顯示其正研究放棄“嘿Siri”,轉而使用AI大模型
近日發(fā)表的一篇論文顯示,蘋(píng)果公司的研究人員正在探索是否有可能使用人工智能來(lái)檢測用戶(hù)何時(shí)對 iPhone 等設備說(shuō)話(huà),從而消除對 Siri 等觸發(fā)詞的技術(shù)需求。
在一篇未經(jīng)同行評審的預印本中,研究人員訓練了一個(gè)大型語(yǔ)言模型,訓練所使用的聲學(xué)數據,來(lái)自智能手機所捕獲的語(yǔ)音和背景噪聲,借此試圖從中尋找用戶(hù)通過(guò)語(yǔ)音喚醒設備的規律。
研究人員表示,該模型中的一部分是用 OpenAI 的 GPT-2 構建的,“因為它相對較小,有可能在智能手機等設備上運行”。
該論文指出,訓練模型所用的數據包括超過(guò) 129 小時(shí)的聲音數據,以及額外的文本數據,但沒(méi)有給出這些數據來(lái)自哪里。
七位作者中有六位列出了他們與蘋(píng)果的關(guān)系,其中三位的 LinkedIn 資料顯示,他們在 Siri 團隊工作。而第七位作者在該公司實(shí)習期間做了與該論文相關(guān)的工作。
該論文稱(chēng),研究結果很有希望。與純音頻或純文本模型相比,模型能夠做出更準確的預測,并且其性能會(huì )隨著(zhù)模型尺寸的增大而提升。
除了探索這個(gè)研究問(wèn)題,目前還不清楚蘋(píng)果是否打算取消“嘿 Siri”這個(gè)經(jīng)典的語(yǔ)音助手觸發(fā)短語(yǔ)。
該公司和論文作者都沒(méi)有立即回復置評請求。
目前,Siri 可以短暫地保存少量音頻,但在聽(tīng)到觸發(fā)短語(yǔ)之前不會(huì )開(kāi)始錄制或準備回答用戶(hù)。
美國斯坦福大學(xué)“以人為本”人工智能研究院的隱私和數據政策研究員簡(jiǎn)·金(Jen King)說(shuō),移除“嘿 Siri”觸發(fā)詞可能會(huì )增加人們對電子設備“總是在監聽(tīng)”的擔憂(yōu)。
此前,蘋(píng)果處理音頻數據的方式曾受到隱私倡導者的審查。2019 年,《衛報》的報道顯示,該公司的質(zhì)量控制承包商在處理 Siri 數據時(shí),經(jīng)常聽(tīng)到從 iPhone 收集的私人音頻,包括醫生和患者之間的敏感對話(huà)。
兩年后,該公司做出了政策改變,包括在設備上存儲更多數據,并允許用戶(hù)選擇不允許他們的錄音被用于改進(jìn) Siri。
2021 年,一場(chǎng)針對該公司的集體訴訟在美國加利福尼亞州提起,指控 Siri 即使在未激活的情況下也會(huì )被打開(kāi)。
(來(lái)源:蘋(píng)果中國官網(wǎng),圖文無(wú)關(guān))
金表示,“嘿 Siri”提示詞對用戶(hù)來(lái)說(shuō)十分重要。其在接受《麻省理工科技評論》采訪(fǎng)時(shí)表示,這些提示詞讓人們了解設備何時(shí)在聽(tīng),去掉這些激活詞可能意味著(zhù)便利性的提升,但降低了透明度。
這項研究沒(méi)有詳細說(shuō)明,觸發(fā)詞是否會(huì )被任何其他信號所取代。
她說(shuō):“一家公司是否應該強制實(shí)施這種形式的互動(dòng),我對此持質(zhì)疑的態(tài)度?!?/span>
最近的一系列信號表明,蘋(píng)果計劃在其產(chǎn)品中加入更多的人工智能技術(shù),該論文是最新信號之一。該公司被認為在人工智能競賽中落后于其他科技巨頭。
根據 VentureBeat 報道,該公司正在構建一個(gè)名為 MM1 的生成式人工智能模型,該模型可以處理文本和圖像,這將是該公司對 Open AI ChatGPT 和其他科技巨頭的聊天機器人的回應。
與此同時(shí),彭博社報道稱(chēng),該公司正在與 Google 就在 iPhone 中使用該公司的人工智能模型 Gemini 展開(kāi)對話(huà)。此外,《華爾街日報》還報道稱(chēng),蘋(píng)果已與百度就使用該公司的人工智能產(chǎn)品進(jìn)行了對話(huà)。
支持:Ren


01/ 復雜分子合成新方法!科學(xué)家將純水作為光化學(xué)反應溶劑,可用于大規模流式合成和藥物修飾
02/ 光芯片領(lǐng)域迎新進(jìn)展:科學(xué)家研發(fā)鈮酸鋰微波光芯片,兼具超寬帶處理和高精度計算
03/ 二氧化碳做輪胎!椿范立院士團隊用CO2造出丁二烯橡膠輪胎,正和業(yè)界合作用于賽車(chē)
04/ 先天性耳聾基因療法獲重大突破,復旦團隊研發(fā)耳聾基因治療藥物,讓多位耳聾患者恢復聽(tīng)力
05/ 中科大團隊開(kāi)發(fā)新型電解體系,成功制備高濃度甲酸,可為燃料電池提供動(dòng)力
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。