超越GPT-4,OpenAI前高管發(fā)布"最強"大模型
3月5日消息,美國時(shí)間周一,人工智能初創(chuàng )公司Anthropic發(fā)布了其最新的人工智能模型Claude 3。該公司聲稱(chēng),Claude 3是迄今為止他們推出的速度最快、性能最強的模型。Claude 3分為三個(gè)不同的版本:Opus、Sonnet和Haiku。
本文引用地址:http://dyxdggzs.com/article/202403/456016.htm據Anthropic介紹,三個(gè)版本中,Opus的能力最為出色,它在多項行業(yè)基準測試中的表現超越了OpenAI的GPT-4和谷歌的Gemini Ultra。這些測試覆蓋了從本科生知識水平到研究生推理能力和基礎數學(xué)等領(lǐng)域。
Claude 3首次引入了多模態(tài)支持功能,用戶(hù)現在能夠直接上傳照片、圖表、文檔等各種非結構化數據,由Claude 3進(jìn)行分析并給出相應的答案。
此外,與Opus相比,Sonnet和Haiku兩個(gè)版本雖然參數規模更小,但相應的使用成本也更低。從本周一起,Opus和Sonnet兩個(gè)版本將在159個(gè)國家上線(xiàn),而Haiku版本也將很快推出。盡管Anthropic沒(méi)有公開(kāi)Claude 3的具體訓練時(shí)間和成本,但已經(jīng)有包括Airtable和Asana在內的多家企業(yè)參與了對這些模型的A/B測試。
僅一年前,Anthropic還是一家由前OpenAI研究高管創(chuàng )立的新興人工智能初創(chuàng )企業(yè),盡管完成了A輪和B輪融資,但其產(chǎn)品尚未引起市場(chǎng)廣泛關(guān)注。然而,短短一年內,Anthropic已經(jīng)成為業(yè)界最受矚目的人工智能初創(chuàng )企業(yè)之一,得到了包括谷歌、Salesforce和亞馬遜等科技巨頭的支持。
該公司的產(chǎn)品不僅在企業(yè)領(lǐng)域與ChatGPT等生成式人工智能模型展開(kāi)了激烈競爭,而且也逐漸滲透到消費者市場(chǎng)。在過(guò)去一年里,這家初創(chuàng )企業(yè)完成了五筆不同的融資,總額約為73億美元。
根據PitchBook的數據,生成式人工智能領(lǐng)域在過(guò)去一年中實(shí)現了爆炸式增長(cháng),2023年的投資額達到了創(chuàng )紀錄的291億美元,涉及近700筆交易,同比增長(cháng)超過(guò)260%。同時(shí),生成式人工智能已成為各大公司財報電話(huà)會(huì )議中的熱門(mén)話(huà)題。盡管學(xué)者和倫理學(xué)家對這項技術(shù)可能帶來(lái)的偏見(jiàn)傳播趨勢表示擔憂(yōu),但生成式人工智能仍然迅速滲透到學(xué)校、在線(xiàn)旅游、醫療行業(yè)、在線(xiàn)廣告等各個(gè)領(lǐng)域。
在一次采訪(fǎng)中,Anthropic的聯(lián)合創(chuàng )始人丹妮拉·阿莫代伊(Daniela Amodei)透露了公司內部的團隊規模和工作分配情況。她表示,大約60至80人致力于核心人工智能模型的研發(fā)工作,而120至150人從事相關(guān)的技術(shù)工作。在今年7月的一份聲明中,阿莫代伊還提到,在Claude 3模型的最后一輪迭代中,由30至35人組成的團隊直接參與了研發(fā),而總共約150人提供了支持。
Anthropic表示,Claude 3模型具有強大的處理能力,每次可處理多達約15萬(wàn)個(gè)單詞,相當于一本長(cháng)篇小說(shuō)的長(cháng)度,例如《白鯨記》(Moby Dick)或《哈利·波特與死亡圣器》(Harry Potter and the Deathly Hallows)。與此相比,先前版本的模型僅能處理7.5萬(wàn)個(gè)單詞。用戶(hù)可以將大型數據集輸入模型,并請求以備忘錄、信件或故事的形式提供摘要。而與之相比,ChatGPT模型的單次處理能力大約為3000個(gè)單詞。
在風(fēng)險應對方面,阿莫代伊表示,Claude 3相較于先前版本有了顯著(zhù)進(jìn)步。她解釋說(shuō):“在努力打造一種高度無(wú)害的模型時(shí),Claude 2在某些情況下會(huì )避免給出回答,尤其是當有人提起敏感或具有爭議性的話(huà)題時(shí),Claude 2的回答可能會(huì )更為保守?!?/p>
Anthropic還指出,Claude 3對用戶(hù)的提示有著(zhù)更深入的理解。多模態(tài)功能——即為生成式人工智能添加照片、視頻等輸入選項——無(wú)論是用戶(hù)自行上傳還是通過(guò)人工智能模型創(chuàng )建,都迅速成為行業(yè)內的一大熱點(diǎn)。
OpenAI首席運營(yíng)官布拉德·萊特卡普(Brad Lightcap)在去年的一次采訪(fǎng)中表示:“現實(shí)世界是多模態(tài)的??紤]到我們人類(lèi)如何處理信息、與世界互動(dòng),比如我們所看到、聽(tīng)到以及談?wù)摰膬热?,可以發(fā)現,這個(gè)世界遠比單純的文字要豐富得多。因此,僅僅依靠文本和代碼作為單一界面展示模型的功能和作用是遠遠不夠的?!?/p>
然而,隨著(zhù)多模態(tài)技術(shù)和人工智能模型的復雜性不斷增加,潛在的風(fēng)險也在逐漸增加。谷歌最近不得不暫停其Gemini聊天機器人的圖像生成功能,原因是用戶(hù)發(fā)現了歷史錯誤和令人不安的回答,這些問(wèn)題在社交媒體上迅速傳播開(kāi)來(lái)。
不同于此,Anthropic的Claude 3模型并不生成圖像,而是允許用戶(hù)上傳圖像和其他文件進(jìn)行分析。阿莫代伊表示:“沒(méi)有任何模型是完美的。我們始終在努力確保模型在功能和安全性方面達到最佳平衡。盡管如此,模型在某些情況下仍可能產(chǎn)生不準確的輸出?!?/p>
評論