谷歌AI掌門(mén)人:發(fā)展AI不能只靠堆硬件,想把大模型和AlphaGo能力結合
2月20日消息,在接受《連線(xiàn)》雜志采訪(fǎng)時(shí),Google DeepMind首席執行官戴米斯·哈薩比斯(Demis Hassabis)表示,盡管人工智能領(lǐng)域已取得了顯著(zhù)的進(jìn)展,但真正的突破尚未到來(lái)。他強調,簡(jiǎn)單地擴大規模無(wú)法推進(jìn)行業(yè)的發(fā)展。
本文引用地址:http://dyxdggzs.com/article/202402/455499.htm在過(guò)去一年中,OpenAI通過(guò)ChatGPT等項目在業(yè)界獨占鰲頭。然而,在哈薩比斯的帶領(lǐng)下,Google DeepMind并未因此氣餒,而是在人工智能模型研發(fā)上展現了強大的競爭力和創(chuàng )新精神。
自從Alphabet去年4月合并了其兩個(gè)人工智能部門(mén)為Google DeepMind后,哈薩比斯一直專(zhuān)注于整合資源,應對OpenAI的崛起及其與微軟的深度合作,后者被Alphabet視為對其核心業(yè)務(wù)——搜索引擎的潛在威脅。
哈薩比斯透露,谷歌研究人員在ChatGPT發(fā)布前已有類(lèi)似想法,但由于擔心濫用和誤用,決定暫不商業(yè)化該技術(shù)。
隨著(zhù)多模態(tài)人工智能模型Gemini的迅猛發(fā)展,Google DeepMind在研究和發(fā)布速度上發(fā)生了巨大變化。Gemini不僅提升了谷歌在與ChatGPT競爭中的實(shí)力,也強化了多個(gè)谷歌產(chǎn)品。Gemini發(fā)布兩個(gè)月后,谷歌推出了更為強大的免費版Gemini Pro 1.5,該模型能同時(shí)分析大量文本、視頻和音頻數據。
隨著(zhù)科技巨頭們紛紛開(kāi)發(fā)和推出更強大、實(shí)用的人工智能系統,Alphabet推出的Gemini Ultra模型無(wú)疑為行業(yè)樹(shù)立了新標桿,并可能促使競爭對手如OpenAI加速研發(fā)。
最近,哈薩比斯在倫敦家中接受了《連線(xiàn)》雜志資深作家威爾·奈特(Will Knight)的專(zhuān)訪(fǎng),深入探討了Gemini Pro 1.5的技術(shù)細節和未來(lái)發(fā)展,及人工智能領(lǐng)域的趨勢。
全文如下:
問(wèn):Gemini Pro 1.5能接收更多數據作為輸入,并采用了名為“專(zhuān)家混合”的架構,這兩者之間是什么關(guān)系?
哈薩比斯:Gemini Pro 1.5能處理適中大小的短片。想象你在學(xué)習某主題,有一個(gè)小時(shí)的視頻講座,你需要找到特定事實(shí)或內容,這非常有用。我相信這將帶來(lái)許多令人驚嘆的用例。
在Google DeepMind首席科學(xué)家杰夫·迪恩(Jeff Dean)的領(lǐng)導下,我們發(fā)明了“專(zhuān)家混合”架構,并不斷優(yōu)化改進(jìn)。盡管Gemini Pro 1.5還未廣泛測試,但性能已與上一代最大模型相當。這表明我們有能力利用這些技術(shù)創(chuàng )新創(chuàng )建更大的模型,這正是我們的努力方向。
問(wèn):計算能力增強和用于訓練AI模型的數據量增加,是否推動(dòng)了人工智能進(jìn)步?據說(shuō),奧特曼打算籌集高達7萬(wàn)億美元資金提高AI芯片產(chǎn)量,更強的計算能力會(huì )開(kāi)啟超級AI之門(mén)嗎?
哈薩比斯:確實(shí),這些因素推動(dòng)了人工智能巨大進(jìn)步。這也是為何像英偉達這樣的公司如此成功,以及OpenAI提高芯片產(chǎn)量加速AI發(fā)展的原因。然而,我認為DeepMind與其他組織有所不同,始終將基礎研究放在首位。在Google Research、Brain和DeepMind等部門(mén),我們在過(guò)去10年的開(kāi)創(chuàng )性工作中發(fā)明了多數機器學(xué)習技術(shù)。這是我們的核心競爭力,我們擁有大量其他機構可能不具備的資深研究科學(xué)家。相較之下,其他公司更注重工程研究以推動(dòng)科學(xué)進(jìn)步。
問(wèn):你認為擴展規模不再是AI發(fā)展唯一途徑?
哈薩比斯:我堅信,實(shí)現通用AI(AGI)需要更多技術(shù)創(chuàng )新和規模擴展。雖然規模擴展仍在繼續,并且沒(méi)有看到任何停止的跡象,但我們不能僅依賴(lài)它獲得新能力,如規劃、工具使用或類(lèi)主體行為,這需技術(shù)創(chuàng )新實(shí)現。我們還需在計算本身探索。我們希望在小型問(wèn)題上實(shí)驗,這只需幾天訓練。但發(fā)現小型規模上有效的方法在擴展時(shí)不適用,所以我們需找到平衡點(diǎn),推斷可能適用于更大規模的方法時(shí)進(jìn)行擴展。
問(wèn):這是否意味著(zhù)未來(lái)AI公司競爭是否將圍繞工具使用和智能體展開(kāi),即AI可以做很多事,不僅限于聊天?據稱(chēng)OpenAI正在研究這個(gè)問(wèn)題。
哈薩比斯:可能。我們在這條路上探索了很長(cháng)時(shí)間。自AlphaGo以來(lái),智能體、強化學(xué)習和規劃一直是我們的主要工作。2016年,DeepMind開(kāi)發(fā)了一種突破性算法,能解決復雜問(wèn)題和玩復雜游戲。我們正在重新審視很多想法,并考慮將AlphaGo的能力與這些大模型結合。內省和規劃能力將有助于消除幻覺(jué)等問(wèn)題。
問(wèn):如何引導模型使其更具邏輯性?
哈薩比斯:這是一個(gè)大領(lǐng)域,我們投入了大量時(shí)間和精力。我們認為,當系統開(kāi)始變得更像智能主體時(shí),這將是它們能力的重大進(jìn)步。我們在這方向投入了大量資金,其他公司也一樣。我一直在安全論壇和會(huì )議上說(shuō),這是一個(gè)大改變。一旦我們讓類(lèi)似智能體的系統工作起來(lái),人工智能就會(huì )與目前系統(基本上是被動(dòng)問(wèn)答系統)大不同,因為它們會(huì )變成主動(dòng)型學(xué)習者。當然,它們也會(huì )更有用,因為能幫你完成任務(wù)。但我們將不得不更加小心。
我一直主張把智能體放到網(wǎng)上之前,用強化的模擬沙盒測試它們。我認為行業(yè)應認真考慮這些系統的出現,并采取措施確保安全性。也許要幾年,也許更早,但這是另一類(lèi)不同的系統。
問(wèn):你提到需要更多時(shí)間來(lái)測試你們最強模型Gemini Ultra。這是因為模型開(kāi)發(fā)進(jìn)度過(guò)快,還是因為這類(lèi)大型模型存在潛在問(wèn)題?
哈薩比斯:實(shí)際上兩方面都有。模型規模越大,微調時(shí)面臨的挑戰越復雜,所需時(shí)間越長(cháng)。更大模型具備更多功能,意味著(zhù)我們需更全面測試。
值得一提的是,隨著(zhù)Google DeepMind變成更成熟穩定的組織,我們開(kāi)始嘗試新的發(fā)布策略。我們會(huì )提前發(fā)布實(shí)驗性功能或模型,并邀請少部分受信任的早期測試者體驗。這樣,我們可以在正式發(fā)布前收集反饋并進(jìn)行必要的調整。
問(wèn):關(guān)于安全性問(wèn)題,你們與英國人工智能安全研究所等政府機構合作進(jìn)展如何?
哈薩比斯:合作非常順利。雖然我不能透露太多細節,因為這是保密的,但可以確認,他們正在對我們的前沿模型包括Gemini Ultra進(jìn)行測試。我們將繼續與他們保持密切合作。
此外,美國也在建立類(lèi)似人工智能安全機構。這些機構都是在布萊切利公園人工智能安全峰會(huì )推動(dòng)下成立的,旨在審查和監管人工智能系統,特別是涉及敏感領(lǐng)域如化學(xué)、生物、放射性和核武器等。目前系統還沒(méi)有強大到足以引發(fā)實(shí)質(zhì)性安全擔憂(yōu)的程度。但加強政府、行業(yè)和學(xué)術(shù)界在人工智能安全方面的合作和投入仍非常必要。隨著(zhù)智能體系統等新型人工智能技術(shù)出現,我們可能面臨更多新挑戰和變化。我們會(huì )看到漸進(jìn)式改進(jìn),可能有很酷的大改進(jìn),但會(huì )感覺(jué)不同。
評論