<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > AI都會(huì )和人類(lèi)談判了？Meta AI最新研究登上Science，LeCun稱(chēng)里程碑式成果

AI都會(huì )和人類(lèi)談判了？Meta AI最新研究登上Science，LeCun稱(chēng)里程碑式成果

發(fā)布人：傳感器技術(shù) 時(shí)間：2022-12-01 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

AI都學(xué)會(huì )和人類(lèi)談判了？還能成功說(shuō)服人類(lèi)聽(tīng)它安排？

話(huà)術(shù)一流到人類(lèi)完全分辨不出它是AI。

這就是Meta AI的最新成果——AI模型CICERO（西塞羅），現已登上Science。

嗯，就是和古羅馬著(zhù)名政治家、演說(shuō)家西塞羅同名。

研究人員讓這個(gè)AI西塞羅隱藏身份加入到一個(gè)外交游戲里，82名人類(lèi)玩家在40場(chǎng)游戲中，都沒(méi)有懷疑過(guò)它其實(shí)是個(gè)AI。

而且還戰績(jì)斐然，全程平均分達到25.8%，是人類(lèi)玩家平均分的2倍，并且最終排名為前10%。

成果一經(jīng)發(fā)布，就在網(wǎng)上引發(fā)熱議。

有人評價(jià)：這意味著(zhù)AI在最具人類(lèi)特點(diǎn)的游戲里戰勝人類(lèi)，超乎想象…

LeCun都稱(chēng)它為：里程碑式的研究！

目前，模型代碼已在GitHub上開(kāi)源。

真有AI縱橫家那感覺(jué)了

AI嘮嗑其實(shí)一直都引人詬病，更別提外交這種需要超高話(huà)術(shù)的場(chǎng)景了。

它需要理解對方的語(yǔ)言、動(dòng)機，制定自己的話(huà)術(shù)策略，并調整好措辭。

有時(shí)甚至還需要“耍心眼”，故意說(shuō)一些假話(huà)給對方設套。

這種超高難度任務(wù)，怎么挑戰？

俗話(huà)說(shuō)一口吃不成胖子。

Meta AI就想到了先從游戲場(chǎng)景來(lái)切入（畢竟AI在玩游戲上是老手了）。

不過(guò)和之前棋類(lèi)或競技游戲不同，外交游戲并沒(méi)有那么強的規則性，運籌帷幄、隨機應變的環(huán)節不少。

實(shí)驗中用到的游戲是webDiplomacy（以下用“外交游戲”指代它）。

這款游戲的背景是1901年的歐洲，7位玩家每人控制一個(gè)大國，通過(guò)相互合作、協(xié)商，盡可能地占領(lǐng)更多領(lǐng)土。

西塞羅的核心是由一個(gè)對話(huà)引擎和一個(gè)戰略推理引擎共同驅動(dòng)的。

簡(jiǎn)單理解，這里的對話(huà)引擎和GPT-3、LaMDA類(lèi)似，戰略推理引擎和AlphaGo相近。

用到的對話(huà)模型，是從一個(gè)類(lèi)似于2.7億參數的BART模型訓練而來(lái)。

BART吸收了GPT和BERT各自的特點(diǎn)，它比BERT更適合文本生成的場(chǎng)景，還能雙向理解上下文語(yǔ)境信息。

具體來(lái)看，研究人員先從互聯(lián)網(wǎng)上獲取文本訓練對話(huà)模型，然后再在實(shí)際的外交游戲場(chǎng)景中微調。

戰略推理引擎用到的是一個(gè)規劃算法（planning algorithm）。

該算法能夠基于現況計算出一個(gè)最優(yōu)選擇。再通過(guò)強化學(xué)習訓練，懲罰模型做出的“不像人”的策略，以此讓模型給出的策略更合理。

畢竟，在外交游戲中是和人打交道，讓AI更像人也是最基本的要求之一。

而且強化學(xué)習這種迭代式的訓練，可以不斷改進(jìn)AI做出的策略預測。比傳統方法中常用的監督學(xué)習（即打標簽的方式）效果更好。

實(shí)操中，西塞羅首先會(huì )根據目前為止的游戲狀態(tài)和對話(huà)，對每個(gè)人的會(huì )采取的動(dòng)作做一個(gè)初步預判。

接下來(lái)，在不斷地協(xié)商過(guò)程中，它都會(huì )不斷地改進(jìn)預測，然后使用這些預測為自己和合作伙伴設置一個(gè)共同的目標。

其次，它會(huì )根據局勢狀態(tài)、對話(huà)及其目標，從對話(huà)模型中生成幾個(gè)候選消息，使用分類(lèi)器等過(guò)濾機制過(guò)濾掉無(wú)意義的，生成最終的高質(zhì)量輸出文本。

例如，以下圖為例，在這一局中，西塞羅扮演“奧地利”。

當玩家“意大利”向它詢(xún)問(wèn)意見(jiàn)，自己是否應該攻擊土耳其時(shí)，西塞羅會(huì )根據場(chǎng)上局勢——土耳其正在攻擊俄羅斯，判斷出這是一個(gè)兩面夾擊的好機會(huì )，然后勸意大利跟進(jìn)攻打土耳其。

這一步既建立了與意大利的伙伴關(guān)系，又消滅了一個(gè)潛在的對手。

不僅如此，談判也是西塞羅的拿手好戲。

這次西塞羅扮演的是“德國”，與玩家“法國”一直在交戰。這時(shí)法國南部同時(shí)受到了意大利的攻擊，于是向西塞羅請求和談。

西塞羅則趁機獅子大開(kāi)口，要求法國歸還侵略的領(lǐng)土，并保證不攻擊荷蘭。雙方在討價(jià)還價(jià)中順利達成了協(xié)議。

就像上述展示的例子一樣，兩個(gè)月間，西塞羅共參與了40場(chǎng)外交游戲，與82名人類(lèi)參賽者交鋒。

在每場(chǎng)比賽中，西塞羅都會(huì )發(fā)送和接收平均130條消息。

其游戲水平甚至強過(guò)了人類(lèi)：平均得分是人類(lèi)玩家的2倍以上，甚至在玩過(guò)一場(chǎng)以上游戲的參與者中也能排到前10% 。

網(wǎng)友：雖然它表現好但我很害怕

看完西塞羅在外交上的精彩表現，有網(wǎng)友感慨AI的發(fā)展速度：

Deep Blue擊敗了卡斯帕羅夫，Watson擊敗了智力競賽的兩位人類(lèi)冠軍，現在輪到Meta AI敲響馬基雅維利（近代政治思想奠基人）的大門(mén)了。

還有人表示，這難道是邁向通識語(yǔ)言大模型的第一步嗎？

LeCun給出了肯定回復：

至少語(yǔ)言是基于事實(shí)的。

不過(guò)由于這款外交游戲以爾虞我詐著(zhù)稱(chēng)，不少人也對此表示擔憂(yōu)：

這是直接鼓勵研究人員開(kāi)發(fā)更多擅長(cháng)騙人的模型。

有網(wǎng)友就表示，玩這游戲甚至會(huì )失去朋友哦。

而從AI西塞羅的戰績(jì)來(lái)看，它可以迷惑人類(lèi)玩家，并且說(shuō)服人類(lèi)聽(tīng)從它的策略。

所以有人就表示，這不是AI控制人類(lèi)的選擇乃至生活？

不過(guò)Meta AI表示，AI西塞羅不是全沒(méi)有失誤的。

并且游戲中也還有很多需要和人類(lèi)協(xié)作的環(huán)節，西塞羅的表現同樣很好。

目前，它還只被放在游戲場(chǎng)景中測試過(guò)，并沒(méi)有嘗試過(guò)在開(kāi)放語(yǔ)境下和人類(lèi)談判。

來(lái)源：量子位

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

EMC相關(guān)文章:EMC是什么意思

低通濾波器相關(guān)文章:低通濾波器原理

電容傳感器相關(guān)文章:電容傳感器原理
雙絞線(xiàn)傳輸器相關(guān)文章:雙絞線(xiàn)傳輸器原理
衰減器相關(guān)文章:衰減器原理

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

釋說(shuō)芯語(yǔ)16：硬科技：構建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

AI驅動(dòng)的嵌入式聲音和振動(dòng)識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

WTC-AI太陽(yáng)能熱水器電路圖

設計方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

加大調整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

WTC-AI型太陽(yáng)能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺電腦... 一臺來(lái)創(chuàng )建AI... 一臺來(lái)模擬AI... 一臺來(lái)運行AI”

智能計算 AI | 2024-07-31

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

國際奧委會(huì )：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會(huì ) 體育 | 2024-07-26

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機器人 | 2021-02-26

萬(wàn)家樂(lè )JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬(wàn)家樂(lè ) | 2013-01-17

海聯(lián)達（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

大嘴業(yè)話(huà)-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

如何快速搭建手寫(xiě)體識別演示系統

視頻 digikey AI 手寫(xiě)體識別 | 2022-07-29

AI+機器視覺(jué)成趨勢，圖文詳解N大應用場(chǎng)景

智能計算安森美 AI 機器視覺(jué) | 2024-07-31

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

蘋(píng)果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

CSR8670CSR8675智能語(yǔ)音Alexa藍牙方案開(kāi)發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

iPhone 16將不會(huì )預裝AI功能？計劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

瑞薩電子AI單元解決方案成功提高GE醫療（日本）日野工廠(chǎng)的生產(chǎn)力

winni945 | 2018-09-12

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>