新版Siri跳票,蘋(píng)果員工痛訴AI危機:我們的船正在下沉
5月19日消息,2018年,蘋(píng)果從谷歌挖來(lái)AI負責人約翰·詹南德里亞(John Giannandrea),試圖扭轉其在人工智能領(lǐng)域的落后局面。然而七年過(guò)去,蘋(píng)果的AI戰略屢屢受挫:承諾的Siri升級多次跳票,自研大模型進(jìn)展緩慢,功能發(fā)布滯后于競爭對手。盡管投入巨資并重組團隊,蘋(píng)果仍面臨技術(shù)短板、內部決策分歧和隱私政策限制等多重挑戰。如今,蘋(píng)果被迫調整策略,一邊加速開(kāi)發(fā)"LLM Siri"新架構,一邊尋求與OpenAI等對手合作。內部人士稱(chēng),在A(yíng)I領(lǐng)域的持續失利正威脅著(zhù)iPhone的主導地位,乃至機器人和其他未來(lái)產(chǎn)品的規劃。
本文引用地址:http://dyxdggzs.com/article/202505/470598.htm以下為英文翻譯節選:
早在2018年,蘋(píng)果的人工智能業(yè)務(wù)似乎終于步入正軌。那年年初,軟件主管克雷格·費德里吉(Craig Federighi)召集高層團隊,宣布了一項重磅人事任命:蘋(píng)果從谷歌挖來(lái)了詹南德里亞出任人工智能業(yè)務(wù)負責人。這位業(yè)內人稱(chēng)“JG”的高管,此前掌管谷歌的搜索和AI團隊,曾推動(dòng)將前沿人工智能技術(shù)應用于Google Photos、Google Translate和Gmail等核心產(chǎn)品。這些成果,加上2014年谷歌對英國AI公司DeepMind的收購,讓該公司在人工智能領(lǐng)域確立了標桿地位。
對蘋(píng)果高層來(lái)說(shuō),延攬詹南德里亞不僅是從最強勁對手手中贏(yíng)得的一場(chǎng)勝利,更被寄予厚望:這或許將是蘋(píng)果向AI巨頭轉型的關(guān)鍵一步。2011年,在聯(lián)合創(chuàng )始人史蒂夫·喬布斯(Steve Jobs)去世前夕,蘋(píng)果首次發(fā)布了語(yǔ)音助手Siri。最初,Siri看起來(lái)宛如科幻電影中走進(jìn)現實(shí)的技術(shù)創(chuàng )新——蘋(píng)果再次將前沿科技變成主流產(chǎn)品。然而,短短幾年后,谷歌、亞馬遜等競爭對手相繼推出更強大的語(yǔ)音助手,而蘋(píng)果的Siri卻在理解能力和執行指令方面問(wèn)題頻出。
出生于蘇格蘭的詹南德里亞被賦予全面統籌蘋(píng)果AI業(yè)務(wù)的職責。多位員工表示,蘋(píng)果在人工智能方面進(jìn)展緩慢,部分原因在于A(yíng)I相關(guān)工作長(cháng)期分散在多個(gè)產(chǎn)品團隊中。詹南德里亞上任后,機器學(xué)習研究、測試部門(mén)以及Siri團隊被整合為統一架構。他直接向首席執行官蒂姆·庫克(Tim Cook)匯報工作,使人工智能成為繼軟件、硬件和服務(wù)之后的第四大核心業(yè)務(wù)。
費德里吉在宣布詹南德里亞的任命時(shí)難掩激動(dòng)之情。自Siri推出以來(lái),該團隊幾經(jīng)易手,最終由他接手,如今則正式交棒給詹南德里亞?!八俏覀冃枰腁I領(lǐng)軍人物,”費德里吉在團隊會(huì )議中表示。許多人認為詹南德里亞在谷歌的地位僅次于CEO,他不僅主導AI戰略,還曾擔任互聯(lián)網(wǎng)先驅網(wǎng)景(Netscape)的首席技術(shù)官?!澳氵€能找到比他更合適的人選嗎?”一位參與招聘的人士反問(wèn)。
努力七年,差距卻越來(lái)越大
然而,七年過(guò)去,詹南德里亞帶來(lái)的希望與樂(lè )觀(guān)早已消退。蘋(píng)果不僅未能在A(yíng)I領(lǐng)域迎頭趕上,反而逐漸被拉開(kāi)了距離。自2022年OpenAI推出ChatGPT以來(lái),全球科技公司紛紛加速開(kāi)發(fā)大語(yǔ)言模型(LLM),將其整合進(jìn)語(yǔ)音助手等工具,并積極向消費者推廣。
蘋(píng)果雖也推出了新AI功能,但往往被外界視為“姍姍來(lái)遲”且“缺乏亮點(diǎn)”。在去年的全球開(kāi)發(fā)者大會(huì )上,蘋(píng)果發(fā)布了“Apple Intelligence”,將其宣傳為“為每個(gè)人打造的人工智能”——呼應1984年首款Mac電腦“為所有人設計的計算機”的標語(yǔ)。
蘋(píng)果承諾,“Apple Intelligence”將具備寫(xiě)作優(yōu)化、郵件與通知摘要、生成功能性圖像和自定義表情符號等能力,并預告Siri將迎來(lái)重磅升級:首次能夠深度訪(fǎng)問(wèn)用戶(hù)的個(gè)人數據與屏幕內容,智能回答個(gè)性化問(wèn)題。在現場(chǎng)演示中,詹南德里亞的一位高管助手請求Siri查詢(xún)其母親的行程安排,系統能無(wú)縫從郵件和短信中提取信息,自動(dòng)構建出一份旅行計劃。蘋(píng)果還表示,用戶(hù)將可通過(guò)Siri實(shí)現更多操作,例如選取、裁剪并發(fā)送照片,全程無(wú)需手動(dòng)觸控。
真正由AI驅動(dòng)的iPhone前景,也助推蘋(píng)果股價(jià)走高。去年9月,蘋(píng)果宣稱(chēng)全新iPhone 16“從底層重構”,以支持Apple Intelligence,引發(fā)市場(chǎng)熱議。然而該機上市時(shí)并未內建AI功能——寫(xiě)作工具與通知摘要等基礎功能推遲一個(gè)半月才上線(xiàn),自定義“生成表情”(Genmojis)直到12月才正式發(fā)布。至于按緊急程度自動(dòng)整理的系統通知功能,則到今年3月才姍姍來(lái)遲。
而備受期待的Siri升級版,據開(kāi)發(fā)團隊透露,原計劃于2025年4月上線(xiàn)。但多位知情高管表示,發(fā)布前數周,費德里吉在使用測試版iOS 18.4時(shí)發(fā)現,多個(gè)宣傳中的功能(例如通過(guò)語(yǔ)音讀取駕駛證號)根本無(wú)法使用。發(fā)布日期先是推遲至5月,隨后再次被無(wú)限期延后——而此時(shí),iPhone 16的廣告中仍在高調宣傳這些尚未實(shí)現的功能。部分用戶(hù)遂以“虛假廣告”為由對蘋(píng)果提起集體訴訟。
新版Siri已確認無(wú)法趕在下月的全球開(kāi)發(fā)者大會(huì )前推出——距離最初宣布整整過(guò)去了一年。用戶(hù)依舊無(wú)法迎來(lái)一次徹底升級的語(yǔ)音助手,更談不上獲得一個(gè)可媲美ChatGPT的成熟產(chǎn)品。目前,他們只能繼續等待蘋(píng)果逐步兌現對Apple Intelligence功能的承諾。
“這是一場(chǎng)危機?!?一位蘋(píng)果人工智能團隊的資深成員直言不諱。另一位成員則將蘋(píng)果當前的人工智能努力比作“一艘正在下沉的船”。根據內部數據,蘋(píng)果的AI技術(shù)仍落后于競爭對手多年。
“后發(fā)制人”策略還有用嗎?
但對蘋(píng)果來(lái)說(shuō),錯失一項可能改變世界的技術(shù),未必就是生死存亡的問(wèn)題。該公司一貫的戰略,是讓競爭對手率先推出新技術(shù)、承擔初期風(fēng)險,自己則在時(shí)機成熟時(shí),向超過(guò)十億用戶(hù)推出精致易用、系統整合良好的版本。蘋(píng)果曾在MP3播放器、智能手機、平板電腦、智能手表乃至耳機產(chǎn)品上,屢次通過(guò)這種“后發(fā)制人”的策略取得成功。
在今年5月的季度財報電話(huà)會(huì )議上,當被問(wèn)及AI相關(guān)功能一再跳票的情況時(shí),首席執行官蒂姆·庫克(Tim Cook)提到了已上線(xiàn)的Apple Intelligence功能,以及它對西班牙語(yǔ)、中文等語(yǔ)言的支持擴展。他強調,Siri升級只是需要更長(cháng)時(shí)間來(lái)達到蘋(píng)果的質(zhì)量標準?!皼](méi)有其他復雜原因,”庫克說(shuō),“只是比我們預期的要花更長(cháng)一點(diǎn)時(shí)間而已?!?/p>
值得關(guān)注的是,盡管蘋(píng)果在A(yíng)I領(lǐng)域投入了巨大的資源,成效卻相對有限。據多位高管透露,長(cháng)期以來(lái),蘋(píng)果的AI專(zhuān)職員工數量遠少于競爭對手,用于訓練與運行大語(yǔ)言模型所需的GPU采購量也嚴重不足。今年,蘋(píng)果高層為此進(jìn)行了一次重大組織架構調整,將Siri和其他AI相關(guān)團隊從詹南德里亞手中劃出。
雖然有員工將這一困境歸咎于個(gè)別高管的判斷失誤,也有人認為問(wèn)題根源更為深層。蘋(píng)果之所以能成為全球最具價(jià)值的科技公司,靠的是精雕細琢的硬件產(chǎn)品、經(jīng)過(guò)嚴格篩選的內容生態(tài),以及每年一次的大型系統更新。但人工智能的發(fā)展節奏截然不同——更快速、更不可預測,也更具侵入性。
蘋(píng)果最成功的產(chǎn)品,通常建立在其自研的核心技術(shù)基礎上,比如iPhone的多點(diǎn)觸控,或iPad和最新Mac所用的自研芯片。但在A(yíng)I領(lǐng)域,這一成功邏輯似乎并未奏效。去年,蘋(píng)果砍掉了曾耗資百億美元的自動(dòng)駕駛汽車(chē)項目,部分原因正是公司意識到:現階段,其人工智能能力無(wú)法實(shí)現真正的自動(dòng)駕駛。
如果AI方面的困境持續下去,蘋(píng)果的多個(gè)未來(lái)項目可能將受到根本性影響——從增強現實(shí)眼鏡、機器人,到能識別周?chē)矬w的智能手表和耳機。如果蘋(píng)果在這場(chǎng)關(guān)于“人與智能設備如何互動(dòng)”的新一輪技術(shù)變革中敗下陣來(lái),其所處的劣勢將極其嚴重。
蘋(píng)果未能及時(shí)推出自有聊天機器人,也令高管層倍感不安。據員工透露,詹南德里亞始終對生成式AI持保守態(tài)度。他曾表示,智能體距離真正替代人類(lèi)還有很長(cháng)路要走,大多數用戶(hù)與他一樣對其信任有限,因此他并未將打造ChatGPT競品視為優(yōu)先事項。他還稱(chēng),用戶(hù)最常提出的請求之一就是“關(guān)閉它”。這種誤判造成方向反復。2025年3月,蘋(píng)果宣布推遲Siri重大升級,并撤下相關(guān)廣告。
Siri的底層架構被“一分為二”
問(wèn)題的根源在于Siri的底層架構已經(jīng)被“一分為二”:舊代碼支撐設置鬧鐘等傳統功能,新代碼則支撐調用個(gè)人數據的新請求。這種“臨時(shí)拼接”的方式被視為將新功能盡快推向市場(chǎng)的必要手段,但最終適得其反,導致整合問(wèn)題頻發(fā),從而造成大量延遲。員工們說(shuō),單個(gè)功能可能看起來(lái)運行良好,但當這些代碼整合在一起、在Siri中統一測試時(shí),就開(kāi)始出問(wèn)題了。
隨著(zhù)項目進(jìn)展受挫,工程團隊的士氣持續低迷。一名成員抱怨:“我們甚至不知道發(fā)生了什么,也不知道為什么發(fā)生,這里缺乏真正的領(lǐng)導力?!?/p>
他很難融入蘋(píng)果核心圈層——這些人一起共事了數十年,把公司當作家族企業(yè)來(lái)運營(yíng)。而他也像此前那些“外來(lái)高管”一樣意識到,在這樣的文化中推行變革異常困難。蘋(píng)果高層由一群強勢的人物組成,最終是否被認可,取決于能否將新產(chǎn)品成功推向市場(chǎng)。相比之下,詹南德里亞性格低調,一些人認為他在爭取所需資源時(shí)不夠積極。
也有人認為,詹南德里亞的管理過(guò)于松散,對團隊要求不夠嚴格。一位高管說(shuō):“蘋(píng)果的其他團隊,至少在工程部門(mén),都是拼命趕工、按時(shí)交付的節奏,但JG的團隊完全不是這樣,他們就是執行力不行?!边@種“被特殊對待”的印象還延伸到了福利上。在蘋(píng)果總部,和其他硅谷科技巨頭不同,員工通常需要自費在食堂用餐。但在詹南德里亞的團隊奮力推進(jìn)Apple Intelligence時(shí),一些工程師卻經(jīng)常能領(lǐng)到免費用餐券,引發(fā)其他團隊的不滿(mǎn)。一位員工說(shuō):“我知道聽(tīng)起來(lái)有點(diǎn)小題大做,但蘋(píng)果一向不給員工提供免費食物。而他們在比別人晚了一年發(fā)布產(chǎn)品的情況下,竟然還能吃白食?!?/p>
詹南德里亞看似缺乏緊迫感,也許更多是一種理念問(wèn)題,而非性格問(wèn)題。他對AI發(fā)展的節奏持保守態(tài)度,對聊天機器人的價(jià)值也持懷疑態(tài)度。他在內部曾主張說(shuō),OpenAI、Meta、谷歌等并不構成緊迫威脅,用戶(hù)真正想要的是一個(gè)可以控制設備的界面型助手。盡管出現了延誤和挫折,他仍然堅持這個(gè)愿景。
當然,失敗從來(lái)不是單方面造成的,將失誤歸咎于個(gè)人過(guò)于簡(jiǎn)單化。據知情人士透露,詹南德里亞本人曾表示,蘋(píng)果的市場(chǎng)營(yíng)銷(xiāo)和廣告團隊才應為過(guò)度宣傳未完成功能承擔更多責任——這些團隊分別由格雷格·喬斯維亞克(Greg Joswiak)和托爾·邁倫(Tor Myhren)負責。產(chǎn)品經(jīng)理有責任向市場(chǎng)部門(mén)明確告知產(chǎn)品何時(shí)才能真正準備就緒。而軟件方面的最終決策人是克雷格·費德里吉(Craig Federighi)。整個(gè)公司的產(chǎn)品文化,最終由蒂姆·庫克(Tim Cook)設定方向。
前首席財務(wù)官盧卡·梅斯特里(Luca Maestri)對購買(mǎi)GPU的保守態(tài)度,事后看起來(lái)也不夠明智。長(cháng)期以來(lái),庫克主導下的蘋(píng)果善于利用其市場(chǎng)主導地位和現金儲備來(lái)塑造全球供應鏈——從半導體到智能手機屏幕玻璃都不例外。但GPU的需求后來(lái)遠遠超過(guò)供應,而蘋(píng)果對這種新興技術(shù)不完全信任、選擇慢慢采購的做法最終自食其果。當亞馬遜、微軟等競爭對手搶購全球大部分GPU時(shí),蘋(píng)果只能眼睜睜看著(zhù)。GPU數量不足,意味著(zhù)蘋(píng)果的AI模型訓練速度明顯滯后。一位AI團隊成員說(shuō):“當競爭對手早就把GPU全搶走了,你不可能憑空變出更多GPU?!?/p>
蘋(píng)果長(cháng)期以來(lái)對用戶(hù)隱私的承諾,也限制了它的發(fā)展。蘋(píng)果擁有23.5億活躍設備,能獲取比許多競爭對手更多的數據——包括網(wǎng)頁(yè)搜索、個(gè)人興趣、通信內容等。但蘋(píng)果對AI研究人員訪(fǎng)問(wèn)用戶(hù)數據的限制,比谷歌、Meta和OpenAI都要嚴格。這種隱私承諾甚至延伸到非蘋(píng)果用戶(hù)的數據:蘋(píng)果的網(wǎng)頁(yè)爬蟲(chóng)Applebot會(huì )抓取網(wǎng)頁(yè)數據,用于Siri、Spotlight和其他搜索功能,但它也允許網(wǎng)站輕松拒絕讓自己的數據被用于改進(jìn)Apple Intelligence。許多網(wǎng)站確實(shí)選擇了屏蔽。
這些因素導致蘋(píng)果的研究人員不得不更依賴(lài)從第三方授權的數據集,或者是所謂的“合成數據”——即為AI訓練而特意生成的人工數據。一位熟悉蘋(píng)果AI和軟件開(kāi)發(fā)的人說(shuō):“在這個(gè)領(lǐng)域有成千上萬(wàn)的‘不準’,你必須突破隱私監管才能做成任何事情?!绷硪晃桓吖芤渤诸?lèi)似觀(guān)點(diǎn):“你看看X的Grok,他們會(huì )越來(lái)越強,因為他們能用整個(gè)X平臺的數據。那蘋(píng)果要用什么來(lái)訓練?”
這又是AI技術(shù)與蘋(píng)果傳統優(yōu)勢“格格不入”的一個(gè)例子。一位在蘋(píng)果工作多年的高管說(shuō):“我們的傳統打法是:我們雖然起步晚,但有10億以上用戶(hù),我們會(huì )堅持下去,最終贏(yíng)得勝利。但這一次,這個(gè)策略行不通了?!?/p>
DeepSeek等新對手不斷涌現
在蘋(píng)果試圖再次挽救其AI業(yè)務(wù)的當下,它還面臨著(zhù)一些獨特的外部挑戰。據知情人士透露,為滿(mǎn)足歐盟即將實(shí)施的監管要求,蘋(píng)果正計劃修改其操作系統,首次允許用戶(hù)將默認語(yǔ)音助手從Siri切換為第三方選項,如果蘋(píng)果產(chǎn)品無(wú)法取得實(shí)質(zhì)性突破,許多用戶(hù)可能真的會(huì )選擇更換語(yǔ)音助手。除了OpenAI、Anthropic、Meta和Alphabet的產(chǎn)品,像DeepSeek這樣的創(chuàng )新型初創(chuàng )公司也在不斷涌現。
據員工透露,如今蘋(píng)果在蘇黎世的AI辦公室正在構建全新的軟件架構,旨在取代目前問(wèn)題纏身的Siri混合系統。這套所謂的“單體模型”(monolithic model)將完全基于大語(yǔ)言模型構建,最終目標是讓Siri的對話(huà)更自然、信息整合更精準。這個(gè)秘密項目毫不意外地被命名為“LLM Siri”。
從得克薩斯到西班牙再到愛(ài)爾蘭,蘋(píng)果部署了數千名分析師,對Apple Intelligence生成的摘要進(jìn)行準確性審查,將輸出結果與原始資料進(jìn)行比對,以確定系統出現AI“幻覺(jué)”(即事實(shí)扭曲)的頻率。得益于最近一次軟件更新,iPhone也開(kāi)始參與改進(jìn)蘋(píng)果的合成數據:通過(guò)將系統生成的假數據與用戶(hù)郵件中的語(yǔ)言進(jìn)行比對,設備能夠為AI訓練提供真實(shí)世界的語(yǔ)言參考點(diǎn)——無(wú)需將用戶(hù)的實(shí)際數據輸入模型。
今年春天,詹南德里亞被剝奪了對產(chǎn)品開(kāi)發(fā)的全部控制權,包括Siri工程團隊和未來(lái)機器人設備項目。據幾位高管透露,此舉是因為庫克對他在打造新產(chǎn)品方面的執行能力失去了信心。Siri現在由邁克·洛克韋爾(Mike Rockwell)接管,他曾領(lǐng)導團隊開(kāi)發(fā)Vision Pro混合現實(shí)頭顯。洛克韋爾直接向費德里吉匯報工作,而后者則接手了更多與蘋(píng)果AI軟件產(chǎn)品路線(xiàn)圖相關(guān)的職責。
詹南德里亞的產(chǎn)品經(jīng)理團隊已歸入費德里吉的管理體系,而洛克韋爾則重組了Siri管理層,將其頭顯項目的得力干將安插進(jìn)關(guān)鍵崗位。原Siri主管沃克手下工程師幾乎全被調離,被轉派至新項目。
詹南德里亞目前仍負責管理AI研究、大語(yǔ)言模型的開(kāi)發(fā)與優(yōu)化、AI分析師團隊以及部分基礎設施團隊。據內部人士透露,部分蘋(píng)果高層曾討論過(guò)進(jìn)一步縮減詹南德里亞的職責,甚至安排他退休(他已年滿(mǎn)60歲)。但費德里吉及其他人擔心,若他離職,他招募進(jìn)蘋(píng)果的頂尖研究員和工程師也可能會(huì )隨之出走。至少目前,詹南德里亞仍留任,并告訴同事他不希望在蘋(píng)果AI工作尚未步入正軌前離開(kāi)。他還坦言,Siri現在歸他人負責,他反而松了一口氣。
知情人士透露,詹南德里亞去年曾力推將谷歌的Gemini集成到Siri中,如今它有望在iOS 19中以ChatGPT替代選項的形式亮相。另有消息稱(chēng),蘋(píng)果也在與新興公司Perplexity展開(kāi)初步洽談,可能讓該公司在Siri中提供ChatGPT替代服務(wù),同時(shí)成為Safari中的AI搜索引擎提供商。
在自研聊天機器人的方向上,盡管詹南德里亞過(guò)去態(tài)度消極,但現在一些高管正推動(dòng)將Siri真正打造為ChatGPT的競爭對手。為此,蘋(píng)果正探討讓Siri能夠訪(fǎng)問(wèn)開(kāi)放網(wǎng)絡(luò ),從多個(gè)來(lái)源抓取并整合信息。據員工稱(chēng),蘋(píng)果內部正在測試的聊天機器人在過(guò)去六個(gè)月內取得顯著(zhù)進(jìn)步,部分高管認為其表現已可媲美最近版本的ChatGPT。
將該聊天機器人整合進(jìn)Siri,有助于為蘋(píng)果提供“雙保險”——以防谷歌每年高達200億美元的搜索默認協(xié)議最終被美國反壟斷監管機構叫停。蘋(píng)果高層對另一項延遲的AI功能也抱有期待:讓Siri能與iPhone應用深度整合,使用戶(hù)能通過(guò)語(yǔ)音更全面地控制設備。這項能力若能實(shí)現,也將使年收入同樣在200億美元左右的應用商店得以繼續在與聊天機器人共存的生態(tài)中保持優(yōu)勢。
據蘋(píng)果內部人士稱(chēng),在將于2025年6月的WWDC亮相的下一版iOS系統中,蘋(píng)果計劃專(zhuān)注于改進(jìn)現有的Apple Intelligence功能,并新增一些能力,例如AI優(yōu)化的電池管理模式和虛擬健身教練。至于Siri的重大升級——包括一年前承諾的內容——可能不會(huì )在大會(huì )上重點(diǎn)討論,距離真正發(fā)布仍需數月時(shí)間。
消息人士還稱(chēng),盡管蘋(píng)果對“LLM Siri”寄予厚望,該公司目前正準備在品牌傳播中將“Apple Intelligence”與“Siri”進(jìn)行切割。這實(shí)則默認了語(yǔ)音助手口碑不佳已拖累AI形象。此外,蘋(píng)果還決定,今后大多數功能將在發(fā)布前不提前幾個(gè)月進(jìn)行公開(kāi)預告。
Siri聯(lián)合創(chuàng )始人基特勞斯對AI版Siri仍持樂(lè )觀(guān)態(tài)度。他說(shuō):“所有大型模型公司都不懂什么是真正的助手,而蘋(píng)果自2010年起就在探索這個(gè)概念?!彼J為,蘋(píng)果現在只需完成“Siri大腦移植”, 憑借其入口優(yōu)勢和品牌認知,完全可能重奪智能助手霸主地位。
評論