GPT-4.5發(fā)布:比GPT-4提升10倍 但"并非前沿模型"
2月28日消息,美國時(shí)間周四,OpenAI宣布推出GPT-4.5,這是其最新、最強大的大語(yǔ)言模型(LLM)的研究預覽版,專(zhuān)為聊天應用設計。不過(guò),這也是OpenAI迄今為止最昂貴的模型。
本文引用地址:http://dyxdggzs.com/article/202502/467433.htm不過(guò),GPT-4.5仍然是一款傳統的大型語(yǔ)言模型,而非“推理模型”。此前,OpenAI、DeepSeek、Anthropic等公司都推出了推理模型,這些模型能夠生成“思維鏈”或類(lèi)似意識流的文本,通過(guò)反思自身的假設和結論,嘗試在向用戶(hù)提供響應或輸出之前捕捉錯誤。
盡管如此,OpenAI聯(lián)合創(chuàng )始人兼首席執行官山姆·奧特曼(Sam Altman)在社交平臺上表示,GPT-4.5是“第一個(gè)讓我感覺(jué)像是在與一個(gè)有思想的人交談的模型。我曾多次靠在椅背上,驚訝于A(yíng)I能給出真正有用的建議?!?/p>
奧特曼還提醒道,由于GPU供應緊張,OpenAI不得不限制對GPT-4.5的訪(fǎng)問(wèn)。他指出:“壞消息是:這是一個(gè)龐大且昂貴的模型。我們本打算同時(shí)向Plus和Pro用戶(hù)推出,但用戶(hù)量大幅增長(cháng)導致GPU資源不足。我們計劃下周增加數萬(wàn)顆GPU,并隨后向Plus訂閱用戶(hù)開(kāi)放。(很快還會(huì )有數十萬(wàn)顆GPU到位,我相信大家會(huì )充分利用我們部署的每一顆GPU。)這并不是我們理想的運作方式,但很難完美預測導致GPU短缺的需求激增?!?/p>
從美國時(shí)間周四開(kāi)始,GPT-4.5將向OpenAI的最昂貴訂閱服務(wù)ChatGPT Pro(每月200美元)的用戶(hù)開(kāi)放,并向所有付費API層級的開(kāi)發(fā)者提供訪(fǎng)問(wèn)權限。OpenAI還計劃在下周將其擴展至價(jià)格相對較低的Plus和Team層級(每月20/30美元)。
GPT-4.5支持搜索功能和畫(huà)布模式,用戶(hù)還可以上傳文件和圖像,但目前還不支持其他多模態(tài)功能,如語(yǔ)音模式、視頻和屏幕共享——至少暫時(shí)不支持。
通過(guò)無(wú)監督學(xué)習推動(dòng)AI進(jìn)步
GPT-4.5代表了人工智能訓練領(lǐng)域的顯著(zhù)進(jìn)步,尤其是在無(wú)監督學(xué)習方面,這大大提升了模型識別模式、建立聯(lián)系以及生成創(chuàng )造性見(jiàn)解的能力。
OpenAI的研究人員提到,GPT-4.5通過(guò)基于較小人工智能模型生成的數據進(jìn)行訓練,這有助于提升其“世界模型”。他們還表示,該模型同時(shí)利用多個(gè)數據中心進(jìn)行預訓練,這意味著(zhù)它采用了一種類(lèi)似于競爭對手Nous Research的去中心化方法。
這種訓練方式顯然幫助GPT-4.5學(xué)會(huì )了生成更自然、更直觀(guān)的交互,同時(shí)更準確地遵循用戶(hù)意圖,并展現出更高的情商。該模型在OpenAI此前關(guān)于人工智能擴展的工作基礎上取得了突破,進(jìn)一步驗證了“增加數據和計算能力有助于提升人工智能性能”的理念。
與前代模型及其他同類(lèi)產(chǎn)品相比,GPT-4.5預計能夠顯著(zhù)減少幻覺(jué)現象(幻覺(jué)率為37.1%,相比之下GPT-4為61.8%),從而使其在處理廣泛話(huà)題時(shí)更加可靠。
GPT-4.5的突出特點(diǎn)
根據OpenAI的說(shuō)法,GPT-4.5旨在創(chuàng )造親切自然、直觀(guān)流暢的對話(huà)。它對語(yǔ)義細微差異和上下文有更強的把握能力,能夠實(shí)現更像人類(lèi)之間的互動(dòng),并更有效地與用戶(hù)協(xié)作。
GPT-4.5通過(guò)擴展的知識庫和敏銳的細微線(xiàn)索解讀能力,在多個(gè)領(lǐng)域展現出色表現,包括:
——寫(xiě)作輔助:優(yōu)化內容、提升清晰度、激發(fā)創(chuàng )意
——編程支持:調試、提出代碼改進(jìn)建議、自動(dòng)化工作流程
——問(wèn)題解決:提供詳細解釋?zhuān)f(xié)助做出實(shí)際決策
此外,GPT-4.5還采用了新的對齊技術(shù),增強了其對人類(lèi)偏好和意圖的理解能力,進(jìn)一步提升了用戶(hù)體驗。
如何訪(fǎng)問(wèn)GPT-4.5?
從美國當地時(shí)間周四開(kāi)始,ChatGPT Pro用戶(hù)可以在網(wǎng)頁(yè)、移動(dòng)端和桌面端的模型選擇菜單中選擇GPT-4.5。OpenAI計劃在下周將該模型擴展到Plus和Team用戶(hù)。
對于開(kāi)發(fā)者,GPT-4.5將通過(guò)OpenAI的API提供,包括Chat Completions API、Assistants API和Batch API。它支持函數調用、結構化輸出、流式傳輸、系統消息和圖像輸入等關(guān)鍵功能,使其成為多種人工智能驅動(dòng)應用的通用工具。不過(guò),GPT-4.5目前尚不支持語(yǔ)音模式、視頻或屏幕共享等多模態(tài)功能。
定價(jià)及對企業(yè)決策者的影響
企業(yè)和團隊領(lǐng)導者可以充分利用GPT-4.5帶來(lái)的各種功能。憑借較低的幻覺(jué)率、增強的可靠性和自然流暢的對話(huà)能力,GPT-4.5能夠支持廣泛的業(yè)務(wù)功能:
——改善客戶(hù)互動(dòng):企業(yè)可以將GPT-4.5集成到支持系統中,以實(shí)現更快、更自然的互動(dòng),同時(shí)減少錯誤
——增強內容生成:營(yíng)銷(xiāo)和傳播團隊可以高效地制作高質(zhì)量、符合品牌的內容
——精簡(jiǎn)運營(yíng):人工智能驅動(dòng)的自動(dòng)化可以幫助調試、優(yōu)化工作流程并支持戰略決策
——可擴展性和定制化:API允許企業(yè)進(jìn)行量身定制,構建符合其特定需求的人工智能解決方案
然而,對于希望通過(guò)GPT-4.5構建應用的第三方開(kāi)發(fā)者來(lái)說(shuō),GPT-4.5的API定價(jià)高得驚人,每百萬(wàn)輸入/輸出token的價(jià)格為75美元/180美元,而GPT-4o的定價(jià)僅為2.50美元/10美元。
隨著(zhù)其他競爭對手模型的發(fā)布——如Anthropic的Claude 3.7、Google的Gemini 2 Pro,以及OpenAI自家的推理“o”系列(o1、o3-mini High、o3)——GPT-4.5的性能提升是否足以抵消其高昂成本,特別是在通過(guò)API使用時(shí),將成為一個(gè)值得關(guān)注的問(wèn)題。
AI研究人員與資深用戶(hù)的早期反應兩極分化
GPT-4.5的發(fā)布在社交平臺上引發(fā)了人工智能研究人員和技術(shù)愛(ài)好者的廣泛討論,尤其是在該模型的“系統卡”(即概述其訓練和評估的技術(shù)文檔)提前泄露后,文檔中包含了一系列官方公告前的基準測試結果。
OpenAI在泄露后發(fā)布的最終版系統卡與泄露版本存在顯著(zhù)差異,刪除了泄露版中“GPT-4.5并非前沿模型,但它是OpenAI最大的LLM,比GPT-4的計算效率提高了10倍以上”的表述。OpenAI的發(fā)言人表示,這一說(shuō)法并不準確。
人工智能模型提供商Nous Research的聯(lián)合創(chuàng )始人Teknium(化名)對OpenAI的新模型表示失望,指出在多語(yǔ)言理解(MMLU)和實(shí)際編碼基準測試中,GPT-4.5相比其他領(lǐng)先的大語(yǔ)言模型(LLM)的改進(jìn)微乎其微。Teknium質(zhì)疑道:“距離GPT-4發(fā)布已經(jīng)過(guò)去2年多,OpenAI投入的資金投入規模擴大上千倍……究竟發(fā)生了什么?”
此外,有人認為,GPT-4.5在軟件工程基準測試中表現遜于o3-mini,這讓人質(zhì)疑此次發(fā)布是否代表了真正的技術(shù)進(jìn)步。
然而,也有部分用戶(hù)為GPT-4.5的潛力辯護,認為其價(jià)值不應僅僅依賴(lài)于基準測試的結果。
軟件開(kāi)發(fā)人員Haider(@slow_developer)強調,GPT-4.5相比GPT-4在計算效率上提升了10倍,并且其在綜合任務(wù)處理能力上優(yōu)于OpenAI專(zhuān)注于STEM領(lǐng)域的o系列模型。
AI新聞發(fā)布者Andrew Curran(@AndrewCurran_)則從定性角度出發(fā),預測GPT-4.5將在寫(xiě)作和創(chuàng )造性思維領(lǐng)域樹(shù)立新標準,并稱(chēng)其為OpenAI的“杰作”。
這些討論凸顯了人工智能領(lǐng)域一個(gè)更廣泛的爭論:技術(shù)進(jìn)步是否應單純通過(guò)基準測試來(lái)衡量,還是應更側重于推理能力、創(chuàng )造力和擬人化交互等定性方面的改進(jìn)?
仍處于研究預覽階段
OpenAI將GPT-4.5定位為研究預覽版,以深入了解其優(yōu)勢與局限性。該公司表示,將繼續探索用戶(hù)與模型的互動(dòng)方式,并挖掘非常規應用場(chǎng)景。
OpenAI稱(chēng):“我們發(fā)布GPT-4.5作為研究預覽版,以更好地了解其優(yōu)勢與局限性。擴展無(wú)監督學(xué)習將繼續推動(dòng)人工智能的進(jìn)步,提升準確性、流暢性和可靠性?!?/p>
隨著(zhù)OpenAI不斷改進(jìn)其模型,GPT-4.5為未來(lái)的人工智能進(jìn)步奠定了基礎,尤其是在推理和工具使用代理方面。盡管GPT-4.5已經(jīng)展示了令人印象深刻的能力,OpenAI仍在積極評估其在生態(tài)系統中的長(cháng)期作用。
憑借更廣泛的知識庫、更高的情商和更自然的對話(huà)能力,GPT-4.5將為各個(gè)領(lǐng)域的用戶(hù)帶來(lái)顯著(zhù)改進(jìn)。OpenAI期待看到開(kāi)發(fā)者、企業(yè)和團隊如何將該模型集成到他們的工作流程和應用中。
隨著(zhù)人工智能技術(shù)的不斷進(jìn)步,GPT-4.5標志著(zhù)OpenAI在追求更強大、更可靠、更符合用戶(hù)需求的語(yǔ)言模型道路上邁出了重要的一步,為企業(yè)領(lǐng)域的創(chuàng )新帶來(lái)了新的機遇。
評論