<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > AI“雙子星”同日聯(lián)動(dòng)：DeepMind加速編程自動(dòng)化，OpenAI新方法解開(kāi)2道國際奧數題

AI“雙子星”同日聯(lián)動(dòng)：DeepMind加速編程自動(dòng)化，OpenAI新方法解開(kāi)2道國際奧數題

發(fā)布人：數據派THU 時(shí)間：2022-02-19 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

作者：劉媛媛、LZM

2022 年開(kāi)年不久，全球人工智能領(lǐng)域兩大明星公司不約而同在今天宣布了重要進(jìn)展：OpenAI 稱(chēng)自己構建了一個(gè)神經(jīng)定理證明器，該證明器學(xué)會(huì )了解決各種具有挑戰性的高中數學(xué)問(wèn)題，包括 AMC12 和 AIME 比賽的問(wèn)題，以及改編自 IMO 的兩個(gè)問(wèn)題。 DeepMind 則表示，由其開(kāi)發(fā)的名為 AlphaCode 的人工智能系統，該系統的“編程能力能與一般人類(lèi)程序員相競爭”。DeepMind 說(shuō)，該系統的結果是朝著(zhù)自主編程邁出的重要一步，盡管現在為止 AlphaCode 的能力不一定能代替普通程序員完成日常編程任務(wù)。本文將分別介紹這兩項成果。
OpenAI：AI 進(jìn)軍數學(xué)

根據 OpenAI 的介紹，他們的證明器使用語(yǔ)言模型來(lái)尋找形式陳述的證明。每次找到一個(gè)新的證明時(shí)，OpenAI 都會(huì )將其用作新的訓練數據，用來(lái)改進(jìn)神經(jīng)網(wǎng)絡(luò )，并使其能夠通過(guò)迭代進(jìn)而找到解決更難更復雜陳述的方案。

OpenAI 在 miniF2F 基準——一個(gè)具有挑戰性的高中奧林匹克問(wèn)題集合，測試中取得了目前的最先進(jìn)的水平（41.2% vs 29.3%）。 OpenAI 的方法稱(chēng)之為陳述課程學(xué)習（statement curriculum learning），包括手動(dòng)收集一組不同難度級別的陳述（沒(méi)有證據），其中最難的陳述與OpenAI的目標基準相似。最初，OpenAI 的神經(jīng)證明器能力很弱，只能證明其中的幾個(gè)。 OpenAI 反復搜索新的證明，并在新發(fā)現的證明上重新訓練 OpenAI 的神經(jīng)網(wǎng)絡(luò )，經(jīng)過(guò) 8 次迭代，最終 OpenAI 的證明器在 miniF2F 上測試時(shí)表現得非常出色。形式數學(xué)是一個(gè)令人興奮的研究領(lǐng)域，首先因為它具有豐富性，讓你可以證明需要推理、創(chuàng )造力和洞察力的任意定理；其次因為它與游戲的相似性——人工智能在游戲領(lǐng)域取得了驚人的成功——因為它用一種自動(dòng)化的方式來(lái)確定證明是否成功（即，由形式系統驗證）。如下面的簡(jiǎn)單示例所示，證明形式陳述需要生成一系列證明步驟，每個(gè)證明步驟都包含對策略的調用。這些策略以數學(xué)術(shù)語(yǔ)作為論據，每個(gè)策略調用都會(huì )將當前要證明的陳述轉換為更容易證明的陳述，直到?jīng)]有任何東西可以證明。
圖1 問(wèn)題1
通過(guò)觀(guān)察發(fā)現，在 OpenAI 的訓練過(guò)程中出現了一種能力，即生成作為戰術(shù)參數所需的原始數學(xué)術(shù)語(yǔ)。如果沒(méi)有神經(jīng)語(yǔ)言模型，這是無(wú)法完成的。下面的證明就是一個(gè)例子：證明步驟提出使用 n+1 作為解決方案（這完全由 OpenAI 的模型生成），其余的正式證明依靠 ring_exp 策略來(lái)驗證它確實(shí)是有效的。
圖2 問(wèn)題2
OpenAI 還觀(guān)察到，OpenAI 的模型和搜索程序能夠生成鏈接多個(gè)非平凡推理步驟的證明。在下面的證明中，模型首先使用存在性陳述的對立。然后使用為它生成一個(gè)見(jiàn)證，并通過(guò)利用 norm_num 策略完成證明。
圖3 問(wèn)題3
OpenAI 的模型經(jīng)過(guò)陳述課程學(xué)習訓練，能夠解決培訓教科書(shū)和 AMC12 和 AIME 比賽中的各種問(wèn)題，以及改編自 IMO 的 2 個(gè)問(wèn)題。下面 OpenAI 展示此類(lèi)生成證明的三個(gè)示例。
圖4 問(wèn)題4
圖5 問(wèn)題5
圖6 問(wèn)題6

形式數學(xué)涉及兩個(gè)主要挑戰，這使得強化學(xué)習的應用不太可能成功。
1）無(wú)限的動(dòng)作空間：形式數學(xué)不僅有一個(gè)非常大的搜索空間（例如圍棋），它還有一個(gè)無(wú)限的動(dòng)作空間。在證明搜索的每一步，模型不是從行為良好的有限動(dòng)作集中進(jìn)行選擇，而是必須從一組復雜且無(wú)限的策略中進(jìn)行選擇，其中涉及必須生成的外生數學(xué)術(shù)語(yǔ)（例如，生成用作見(jiàn)證的數學(xué)語(yǔ)句，諸如“存在一個(gè) xx st ...”之類(lèi)的步驟中使用的對象“，或作為剪切，證明中間引理引入和鏈接）。
2）缺乏自我博弈：與二人博弈相反，證明器不是與對手比賽，而是與一組要證明的陳述進(jìn)行比賽。當面對一個(gè)太難的陳述時(shí)，沒(méi)有明顯的重構可以讓證明器生成中間更容易首先解決的陳述。這種不對稱(chēng)性阻止了在二人博弈中成功的自我博弈算法的應用。
在 OpenAI 的工作中，通過(guò)在搜索證明時(shí)，從語(yǔ)言模型中采樣動(dòng)作來(lái)解決無(wú)限動(dòng)作空間問(wèn)題。語(yǔ)言模型能夠生成策略調用以及通常需要作為參數的原始數學(xué)術(shù)語(yǔ)。
其次，OpenAI 觀(guān)察到自我博弈在二人博弈中的關(guān)鍵作用是提供無(wú)監督的課程，以此作為解決缺乏自我博弈的基礎，OpenAI 的方法建議用一組不同難度的輔助問(wèn)題陳述（不需要證明）來(lái)代替這種無(wú)監督的課程。OpenAI 的經(jīng)驗表明，當這些輔助問(wèn)題的難度足夠多時(shí)，OpenAI 的訓練程序能夠解決越來(lái)越難的問(wèn)題的課程，最終推廣到 OpenAI 關(guān)心的問(wèn)題集。
雖然這些結果非常令人興奮，它們證明了深度學(xué)習模型在與正式系統交互時(shí)能夠進(jìn)行非凡的數學(xué)推理，但與這些比賽中最好的學(xué)生的表現相比，OpenAI 的方法還差得很遠。未來(lái)，OpenAI 希望，自己的工作能夠激發(fā)該領(lǐng)域的研究，特別是針對 IMO 大挑戰，與此同時(shí)，OpenAI 提出的陳述式課程學(xué)習方法，或將有助于加速自動(dòng)化推理的總體進(jìn)展。
DeepMind：寫(xiě)代碼自動(dòng)化更進(jìn)一步
DeepMind 創(chuàng )建了一個(gè)名為 AlphaCode 的人工智能系統，該系統的“編程能力能與一般人類(lèi)程序員相競爭”。

開(kāi)發(fā)團隊針對人類(lèi)競賽中使用的編程挑戰題目測試了該人工智能系統，發(fā)現其程序達到了“預期的排名”，使其在人類(lèi)程序員中排名前 54%。DeepMind 說(shuō)，該系統的結果是朝著(zhù)自主編程邁出的重要一步，盡管現在為止 AlphaCode 的能力不一定能代替普通程序員完成日常編程任務(wù)。 DeepMind 的首席研究科學(xué)家 OriolVinyals 通過(guò)電子郵件告訴 The Verge，研究仍處于早期階段，但結果使公司更接近于創(chuàng )建一個(gè)靈活的、解決問(wèn)題的人工智能——一個(gè)可以自主應對目前僅屬于人類(lèi)領(lǐng)域的編碼挑戰的程序。Vinyals 說(shuō)：“從長(cháng)遠來(lái)看，我們對【AlphaCode】幫助程序員和非程序員編寫(xiě)代碼、提高生產(chǎn)力或者創(chuàng )建新的軟件制作方法的潛力感到興奮?！?/span> AlphaCode 根據 Codeforces 策劃的挑戰進(jìn)行了測試，Codeforces 是一個(gè)競爭性的編碼平臺，每周共享問(wèn)題，并為編碼人員發(fā)布類(lèi)似于國際象棋中使用的 Elo 評級系統的排名。這些挑戰不同于編碼器在制作（例如商業(yè)應用程序）時(shí)可能面臨的任務(wù)類(lèi)型。它們更自成一體，需要更廣泛地了解計算機科學(xué)的算法和理論概念。把它們想象成結合了邏輯、數學(xué)和編碼專(zhuān)業(yè)知識的非常專(zhuān)業(yè)的謎題。在 AlphaCode 測試的一個(gè)示例挑戰中，要求競爭對手找到一種方法，使用有限的輸入集將一串隨機、重復的s和t字母轉換為另一串相同的字母。例如，競爭對手不能只鍵入新字母，而是必須使用刪除原始字符串中幾個(gè)字母的“退格”命令。您可以閱讀以下挑戰的完整描述：

其中 10 個(gè)挑戰以與人類(lèi)完全相同的格式輸入 AlphaCode。然后，AlphaCode 生成大量可能的答案，并像人類(lèi)競爭對手一樣通過(guò)運行代碼和檢查輸出來(lái)篩選這些答案?！罢麄€(gè)過(guò)程是自動(dòng)的，無(wú)需人工選擇最佳樣本，”AlphaCode 論文的聯(lián)合負責人 Yujia Li 和 David Choi 通過(guò)電子郵件告訴 The Verge。 AlphaCode 針對 Codeforces 網(wǎng)站上 5,000 名用戶(hù)解決的 10 項挑戰進(jìn)行了測試。平均而言，它的排名在前 54.3%，DeepMind 估計這使該系統的 Codeforces Elo 為 1238，這使其在過(guò)去六個(gè)月中在該網(wǎng)站上競爭的用戶(hù)中排名前 28%。 “我可以肯定地說(shuō) AlphaCode 的結果超出了我的預期，”Codeforces 創(chuàng )始人 Mike Mirzayanov 在 DeepMind 發(fā)布的一份聲明中這樣說(shuō)?！拔页謶岩蓱B(tài)度，因為即使在簡(jiǎn)單的競爭問(wèn)題中，通常不僅需要實(shí)現算法，更需要（這是最困難的部分）發(fā)明它。AlphaCode 成功地達到了一個(gè)有前途的、新競爭對手的水平?！?/span>

DeepMind 指出，AlphaCode 目前的技能僅適用于競爭性編程領(lǐng)域，但它的能力為創(chuàng )建未來(lái)工具打開(kāi)了新大門(mén)，這些工具使編程更易于進(jìn)行，并且有朝一日完全自動(dòng)化。許多其他公司正在開(kāi)發(fā)類(lèi)似的應用程序。例如，微軟和 AI 實(shí)驗室 OpenAI 已將后者的語(yǔ)言生成程序 GPT-3 改編為輸出代碼字符串的自動(dòng)完成程序。（與 GPT-3 一樣，AlphaCode 也基于稱(chēng)為 transformer 的 AI 架構，它特別擅長(cháng)解析自然語(yǔ)言和代碼這類(lèi)順序文本）。對于終端用戶(hù)來(lái)說(shuō)，這些系統就像 Gmail 的 Smart Compose 功能一樣工作：為完成您正在編寫(xiě)的任何內容出謀劃策。近年來(lái)，人工智能編程系統的開(kāi)發(fā)取得了很大進(jìn)展，但這些系統還遠未準備好接管人類(lèi)程序員的工作。他們產(chǎn)出的代碼通常有些問(wèn)題，而且由于系統通常是在公共代碼庫上進(jìn)行訓練的，因此他們有時(shí)會(huì )“復制”受版權保護的材料。在一項由代碼存儲庫 GitHub 開(kāi)發(fā)的名為 Copilot 的 AI 編程工具的研究中，研究人員發(fā)現其輸出代碼的大約 40% 包含安全漏洞。安全分析師甚至建議，不良行為者可以故意編寫(xiě)代碼并與隱藏的在線(xiàn)后門(mén)共享代碼，然后這些代碼可能被用來(lái)訓練人工智能程序，將這些錯誤插入到未來(lái)的程序中。像這樣的挑戰意味著(zhù)人工智能編程系統可能會(huì )慢慢融入程序員的工作中——從助手開(kāi)始，他們的建議在能夠被信任之前都將受到懷疑。換句話(huà)說(shuō)：他們要香徒弟跟師傅一樣接受專(zhuān)業(yè)程序員的訓練。目前為止，這些 AI 編程系統正在飛快地學(xué)習。

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

AI+機器視覺(jué)成趨勢，圖文詳解N大應用場(chǎng)景

智能計算安森美 AI 機器視覺(jué) | 2024-07-31

WTC-AI型太陽(yáng)能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

海聯(lián)達（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺電腦... 一臺來(lái)創(chuàng )建AI... 一臺來(lái)模擬AI... 一臺來(lái)運行AI”

智能計算 AI | 2024-07-31

加大調整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

CSR8670CSR8675智能語(yǔ)音Alexa藍牙方案開(kāi)發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

大嘴業(yè)話(huà)-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

AI驅動(dòng)的嵌入式聲音和振動(dòng)識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

萬(wàn)家樂(lè )JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬(wàn)家樂(lè ) | 2013-01-17

國際奧委會(huì )：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會(huì ) 體育 | 2024-07-26

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機器人 | 2021-02-26

蘋(píng)果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

iPhone 16將不會(huì )預裝AI功能？計劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

瑞薩電子AI單元解決方案成功提高GE醫療（日本）日野工廠(chǎng)的生產(chǎn)力

winni945 | 2018-09-12

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

釋說(shuō)芯語(yǔ)16：硬科技：構建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

WTC-AI太陽(yáng)能熱水器電路圖

設計方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

如何快速搭建手寫(xiě)體識別演示系統

視頻 digikey AI 手寫(xiě)體識別 | 2022-07-29

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>