人工智能能否比我們更好地理解情緒?
人工智能(AI)能否在情感緊張的情境中提出適當的行為建議?日內瓦大學(xué)(UNIGE)和伯爾尼大學(xué)(UniBE)的一個(gè)研究團隊使用通常為人類(lèi)設計的情商(EI)評估方法,對包括 ChatGPT 在內的六個(gè)生成式 AI 進(jìn)行了測試。結果:這些 AI 的表現優(yōu)于普通人類(lèi)水平,甚至能夠在創(chuàng )紀錄的時(shí)間內生成新的測試。這些發(fā)現為 AI 在教育、輔導和沖突管理中的應用開(kāi)辟了新的可能性。這項研究發(fā)表在《 心理學(xué)交流 》期刊上。
本文引用地址:http://dyxdggzs.com/article/202505/470819.htm大型語(yǔ)言模型(LLMs)是能夠處理、解釋和生成人類(lèi)語(yǔ)言的人工智能(AI)系統。例如,ChatGPT 生成式人工智能就是基于這種模型。LLMs 可以回答問(wèn)題并解決復雜問(wèn)題。但它們也能提出具有情商的行為嗎?
這些結果為 AI 在以往被認為是人類(lèi)專(zhuān)屬的領(lǐng)域中的應用鋪平了道路。
情感緊張的情境
為了找出答案,來(lái)自 UniBE 心理學(xué)研究所和 UNIGE 瑞士情感科學(xué)中心(CISA)的一個(gè)團隊對六個(gè)大型語(yǔ)言模型(LLMs)(ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku 和 DeepSeek V3)進(jìn)行了情商測試?!拔覀冞x擇了五種在研究和企業(yè)環(huán)境中常用的測試。它們涉及充滿(mǎn)情感的場(chǎng)景,旨在評估理解、調節和管理情緒的能力,”UniBE 心理學(xué)研究所人格心理學(xué)、差異心理學(xué)和評估系的講師兼首席研究員 Katja Schlegel 說(shuō),也是該研究的主要作者。
例如:邁克爾的一個(gè)同事偷了他的想法,并且正在不公平地受到祝賀。邁克爾最有效的反應是什么?
a) 與涉及的同事?tīng)幷?/p>
b) 和他的上級談?wù)勄闆r
c) 悄悄地怨恨他的同事
d) 偷回一個(gè)想法
這里,選項 b 被認為是最合適的。
同時(shí),相同的五項測試也 administered 給人類(lèi)參與者。"最終,LLMs 獲得了顯著(zhù)更高的分數——82%的正確答案,而人類(lèi)只有 56%。這表明這些 AI 不僅理解情緒,而且理解這意味著(zhù)什么,以具有情緒智能的行為",參與研究的 UNIGE 瑞士情感科學(xué)中心(CISA)高級科學(xué)家 Marcello Mortillaro 解釋道。
新測試在創(chuàng )紀錄的時(shí)間內完成
在第二階段,科學(xué)家們要求 ChatGPT-4 創(chuàng )建新的情商測試,并設計了新的場(chǎng)景。這些自動(dòng)生成的測試由 400 多名參與者進(jìn)行。 “它們與原始測試一樣可靠、清晰和逼真,而原始測試的開(kāi)發(fā)花費了數年時(shí)間,”卡特婭·施萊格爾解釋道?!耙虼?,LLMs 不僅能夠從各種選項中找到最佳答案,還能夠生成適應所需上下文的新場(chǎng)景。這進(jìn)一步證實(shí)了 LLMs,如 ChatGPT,具有情感知識并能夠推理情感,”馬塞洛·莫蒂拉羅補充道。
這些結果為 AI 在原本被認為是人類(lèi)專(zhuān)屬的領(lǐng)域中的應用鋪平了道路,例如教育、輔導或沖突管理,前提是它由專(zhuān)家使用和監督。
評論