<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > OpenAI總裁:GPT-4并不完美但卻絕對與眾不同

OpenAI總裁:GPT-4并不完美但卻絕對與眾不同

作者: 時(shí)間:2023-03-16 來(lái)源:網(wǎng)易科技 收藏

3月16日消息,人工智能研究公司于昨日發(fā)布了備受期待的文本生成AI模型。聯(lián)合創(chuàng )始人兼總裁格雷格·布羅克曼(Greg Brockman)在接受采訪(fǎng)時(shí)表示,并不完美,但卻絕對與眾不同。

本文引用地址:http://dyxdggzs.com/article/202303/444484.htm


在其前身GPT-3的基礎上,在許多關(guān)鍵方面進(jìn)行了改進(jìn),例如提供了更多真實(shí)的陳述,并允許開(kāi)發(fā)人員更容易控制其風(fēng)格和行為。從某種意義上說(shuō),GPT-4也是多模式的,因為它可以理解圖像,能給照片添加注釋?zhuān)踔猎敿毭枋稣掌械膬热荨?/p>

但GPT-4也有嚴重的缺陷。就像GPT-3一樣,該模型會(huì )產(chǎn)生“幻覺(jué)”(即模型聚合的文本與源文本無(wú)關(guān)或不夠準確),并會(huì )犯下基本的推理錯誤。在自己的博客上舉了一個(gè)例子,GPT-4將“貓王”埃爾維斯·普雷斯利(Elvis Presley)描述為“演員的兒子”,但實(shí)際上他的父母都不是演員。

當被要求將GPT-4與GPT-3進(jìn)行比較時(shí),布羅克曼只給出了四個(gè)字回答:與眾不同。他解釋稱(chēng):“GPT-4絕對與眾不同,盡管它還存在很多問(wèn)題和錯誤。但你可以看到其在微積分或法律等學(xué)科技能方面的躍升。它在某些領(lǐng)域的表現曾很糟糕,現在卻已經(jīng)達到超越普通人的水準?!?/p>

測試結果支持了布羅克曼的觀(guān)點(diǎn)。在高考微積分考試中,GPT-4得4分(滿(mǎn)分5分),GPT-3得1分,介于GPT-3和GPT-4之間的GPT-3.5也得4分。在模擬律師考試中,GPT-4成績(jì)進(jìn)入了前10%行列,而GPT-3.5的分數在后10%左右徘徊。

與此同時(shí),GPT-4更受人關(guān)注的地方在于上面提到的多模式。與GPT-3和GPT-3.5不同,它們只能接受文本提示,例如可以要求“寫(xiě)一篇關(guān)于長(cháng)頸鹿的文章”,而GPT-4可以同時(shí)接受圖像和文本提示來(lái)執行某些操作,比如識別在塞倫蓋蒂拍攝的長(cháng)頸鹿圖像,并給出基本的內容描述。

這是因為GPT-4是針對圖像和文本數據進(jìn)行培訓的,而它的前身只針對文本進(jìn)行了培訓。OpenAI表示,培訓數據來(lái)自“各種合法授權的、公開(kāi)可用的數據源,其中可能包括公開(kāi)可用的個(gè)人信息”,但當被要求提供細節時(shí),布羅克曼表示拒絕。訓練數據以前也曾讓OpenAI陷入法律糾紛。

GPT-4的圖像理解能力給人留下了相當深刻的印象。例如,輸入提示“這張圖片有什么好笑的?GPT-4會(huì )將整張圖片分解,并正確地解釋了這個(gè)笑話(huà)的笑點(diǎn)。

目前,只有一個(gè)合作伙伴可以使用GPT-4的圖像分析功能,這是一款針對視障人士的輔助應用程序,名為Be My Eyes。布羅克曼說(shuō),在OpenAI評估風(fēng)險和利弊的過(guò)程中,無(wú)論何時(shí),更廣泛的推廣都將是“緩慢而有意的”。

他還稱(chēng):“有些政策問(wèn)題也需要解決,比如面部識別和如何處理人的圖像。我們需要找出危險區域在哪里,紅線(xiàn)在哪里,然后隨著(zhù)時(shí)間的推移找到解決方案?!?/p>

OpenAI在其文本到圖像轉換系統Dall-E 2上也遇到了類(lèi)似倫理困境。在最初禁用該功能后,OpenAI允許客戶(hù)上傳人臉,以使用AI支持的圖像生成系統對其進(jìn)行編輯。當時(shí),OpenAI聲稱(chēng),其安全系統的升級使面部編輯功能成為可能,因為它將深度造假以及試圖創(chuàng )造色情、政治和暴力內容的潛在危害降至最低。

另一個(gè)長(cháng)期問(wèn)題是防止GPT-4在無(wú)意中被用于可能造成傷害的方式使用。該模型發(fā)布幾小時(shí)后,以色列網(wǎng)絡(luò )安全初創(chuàng )公司Adversa AI發(fā)布了一篇博客文章,演示了繞過(guò)OpenAI的內容過(guò)濾器并讓GPT-4生成釣魚(yú)電子郵件、對同性戀者的攻擊性描述以及其他令人反感文本的方法。

這在語(yǔ)言模型領(lǐng)域并不是新問(wèn)題。Facebook母公司Meta的聊天機器人BlenderBot和OpenAI的ChatGPT也曾被誘惑輸出不恰當的內容,甚至透露了它們內部工作的敏感細節。但包括記者在內的許多人曾希望,GPT-4可能會(huì )在這方面帶來(lái)重大改進(jìn)。

當被問(wèn)及GPT-4的健壯性時(shí),布羅克曼強調,該模型已經(jīng)經(jīng)過(guò)了六個(gè)月的安全培訓。在內部測試中,它對OpenAI使用政策不允許的內容請求做出響應的可能性比GPT-3.5低82%,產(chǎn)生“事實(shí)”響應的可能性比GPT-3.5高40%。

布羅克曼說(shuō):“我們花了很多時(shí)間試圖了解GPT-4的能力。我們正在不斷更新,包括一系列改進(jìn),這樣該模型就更具可擴展性,以適應人們希望它擁有的個(gè)性或模式?!?/p>

坦率地說(shuō),早期的現實(shí)測試結果并不是那么讓人滿(mǎn)意。除了Adversa AI測試之外,微軟的聊天機器人Bing Chat也被證明非常容易越獄。使用精心設計的輸入,用戶(hù)能夠讓該聊天機器人表達愛(ài)意,發(fā)出威脅傷害,為大屠殺辯護,并發(fā)明陰謀論。

布羅克曼并未否認GPT-4在這方面的不足,但他強調了該模型的新限制工具,包括被稱(chēng)為“系統”消息的API級功能。系統消息本質(zhì)上是為GPT-4的交互設定基調并建立界限的指令。例如,一條系統消息可能是這樣寫(xiě)的:“你是一位總是以蘇格拉底風(fēng)格回答問(wèn)題的導師。你永遠不會(huì )給學(xué)生答案,而是總是試著(zhù)問(wèn)正確的問(wèn)題,幫助他們學(xué)會(huì )獨立思考?!?/p>

其思想是,系統消息充當護欄,防止GPT-4偏離軌道。布羅克曼說(shuō):“真正弄清楚GPT-4的語(yǔ)氣、風(fēng)格和實(shí)質(zhì)一直是我們非常關(guān)注的問(wèn)題。我認為我們開(kāi)始更多地了解如何進(jìn)行工程設計,如何擁有一個(gè)可重復的過(guò)程,讓你得到對人們真正有用的可預測結果?!?/p>

布羅克曼還提到了Evals,這是OpenAI最新的開(kāi)源軟件框架,用于評估其AI模型的性能,這是OpenAI致力于“增強”其模型的標志。Evals允許用戶(hù)開(kāi)發(fā)和運行評估模型(如GPT-4)的基準測試,同時(shí)檢查它們的性能,這是一種眾包的模型測試方法。

布羅克曼說(shuō):“有了Evals,我們可以更好地看到用戶(hù)關(guān)心的用例,并可以對其進(jìn)行測試。我們之所以開(kāi)源這個(gè)框架,部分原因是我們不再每隔三個(gè)月發(fā)布一個(gè)新模型以不斷改進(jìn)。你不會(huì )制造你不能測量的東西,對吧?但隨著(zhù)我們推出新版模型,我們至少可以知道發(fā)生了哪些變化?!?/p>

布羅克曼還被問(wèn)道,OpenAI是否會(huì )補償人們用Evals測試它的模型?他不愿就此做出承諾,但他確實(shí)指出,在有限的時(shí)間內,OpenAI允許提出申請的Eevals用戶(hù)提前訪(fǎng)問(wèn)GPT-4 API。

布羅克曼還談到了GPT-4的上下文窗口,該窗口指的是模型在生成額外文本之前可以考慮的文本。OpenAI正在測試一種版本的GPT-4,它可以“記住”大約50頁(yè)內容,是普通GPT-4“內存”的5倍,是GPT-3的8倍。

布羅克曼認為,擴展的上下文窗口會(huì )帶來(lái)新的、以前從未探索過(guò)的用例,特別是在企業(yè)中。他設想了一款為公司打造的AI聊天機器人,它可以利用來(lái)自不同來(lái)源(包括各部門(mén)員工)的背景和知識,以一種非常內行但具有對話(huà)性的方式回答問(wèn)題。

這并不是一個(gè)新概念。但布羅克曼認為,GPT-4的答案將比目前其他聊天機器人和搜索引擎提供的答案有用得多。他說(shuō):“以前,模型根本不知道你是誰(shuí),你對什么感興趣等。而擁有更大的上下文窗口肯定會(huì )讓它變得更強,從而大大增強它能為人們提供的支持?!?/p>




關(guān)鍵詞: OpenAI GPT-4

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>