<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > Facebook首次開(kāi)源超級圍棋AI,復現AI高手AlphaZero

Facebook首次開(kāi)源超級圍棋AI,復現AI高手AlphaZero

作者: 時(shí)間:2019-02-18 來(lái)源:鎂客網(wǎng) 收藏

  最近,研究所(以下簡(jiǎn)稱(chēng)FAIR)宣布,他們開(kāi)源了自研的圍棋AI訓練模型和代碼。這意味著(zhù),你可以隨時(shí)隨地和下圍棋了,而且此圍棋AI程序重現的是名噪一時(shí)的AI高手AlphaZero。

本文引用地址:http://dyxdggzs.com/article/201902/397647.htm

  

Facebook首次開(kāi)源超級圍棋AI,復現AI高手AlphaZero


  去年5月,FAIR發(fā)布了ELF Open GO,ELF OpenGo是FAIR依照DeepMind在《自然》上發(fā)表的和AlphaGo Zero以及AlphaZero相關(guān)的論文,做出的開(kāi)源計算機圍棋程序,也就是說(shuō),ELF OpenGo不使用人類(lèi)棋譜與累積的圍棋知識,僅使用單一類(lèi)神經(jīng)網(wǎng)絡(luò )從自我對弈中學(xué)習。

  該圍棋AI之前在和韓國棋院的專(zhuān)業(yè)圍棋選手對弈中,都取得不錯的成績(jì)。據悉,OpenGo 的最新版本使用2000塊GPU訓練了15天后,在一塊GPU的情況下與4個(gè)排名前30的職業(yè)選手進(jìn)行比賽時(shí),取得了20:0全勝的戰績(jì),可謂是戰無(wú)不勝。

  

Facebook首次開(kāi)源超級圍棋AI,復現AI高手AlphaZero


  在這次開(kāi)源的論文中,FAIR研究人員全面披露了ELF OpenGo的訓練過(guò)程,包括取得的是三個(gè)突破。

  一是為ELF OpenGo訓練了一個(gè)超人類(lèi)棋藝的模型,他們在2000個(gè)GPU上運行類(lèi)AlphaZero的訓練軟件9天后,有20個(gè)模塊的模型超越了人類(lèi)水平。

  二是提供了模型在訓練過(guò)程中的行為分析,包括和其他模型的對比、學(xué)習速度、學(xué)習難度等等。

  三是通過(guò)實(shí)施ablation實(shí)驗,以研究AlphaZero風(fēng)格算法的性質(zhì),他們發(fā)現對于最終模型而言,對局中加倍rollout水平大約提升200 ELO,AI的發(fā)揮會(huì )受到模型容量的限制。

  最后,此次論文的主要作者為田淵棟,他一直負責的圍棋AI相關(guān)研究,在此前的一篇知乎文章中,他提到:DeepMind不開(kāi)源也不透露細節,文章里面一些地方也沒(méi)有寫(xiě)得很清楚。沒(méi)有第一手經(jīng)驗總不是很踏實(shí)。所以本著(zhù)研究目的,我們需要復現一下,先有復現,才有創(chuàng )新,這個(gè)是做研究的習慣。而且如果我們去看 ELF OpenGo 的代碼,會(huì )發(fā)現其完全適用于其它方向的工作。而圍棋對我們來(lái)說(shuō),只是一個(gè)把算法和平臺做好的手段。在這一點(diǎn)上,花點(diǎn)時(shí)間把圍棋做好是值得的。

  最后,關(guān)于ELF OpenGo最新訓練模型的具體數據可以閱讀原文獲取論文鏈接了解。



關(guān)鍵詞: Facebook 人工智能

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>