訂閱
糾錯
加入自媒體

Facebook首次開源超級圍棋AI,復(fù)現(xiàn)AI高手AlphaZero

最近,F(xiàn)acebook的人工智能研究所(以下簡稱FAIR)宣布,他們開源了自研的圍棋AI訓練模型和代碼。這意味著,你可以隨時隨地和Facebook的人工智能下圍棋了,而且此圍棋AI程序重現(xiàn)的是名噪一時的AI高手AlphaZero。

去年5月,F(xiàn)AIR發(fā)布了ELF Open GO,ELF OpenGo是FAIR依照DeepMind在《自然》上發(fā)表的和AlphaGo Zero以及AlphaZero相關(guān)的論文,做出的開源計算機圍棋程序,也就是說,ELF OpenGo不使用人類棋譜與累積的圍棋知識,僅使用單一類神經(jīng)網(wǎng)絡(luò)從自我對弈中學習。

該圍棋AI之前在和韓國棋院的專業(yè)圍棋選手對弈中,都取得不錯的成績。據(jù)悉,OpenGo 的最新版本使用2000塊GPU訓練了15天后,在一塊GPU的情況下與4個排名前30的職業(yè)選手進行比賽時,取得了20:0全勝的戰(zhàn)績,可謂是戰(zhàn)無不勝。

在這次開源的論文中,F(xiàn)AIR研究人員全面披露了ELF OpenGo的訓練過程,包括取得的是三個突破。

一是為ELF OpenGo訓練了一個超人類棋藝的模型,他們在2000個GPU上運行類AlphaZero的訓練軟件9天后,有20個模塊的模型超越了人類水平。

二是提供了模型在訓練過程中的行為分析,包括和其他模型的對比、學習速度、學習難度等等。

三是通過實施ablation實驗,以研究AlphaZero風格算法的性質(zhì),他們發(fā)現(xiàn)對于最終模型而言,對局中加倍rollout水平大約提升200 ELO,AI的發(fā)揮會受到模型容量的限制。

最后,此次論文的主要作者為田淵棟,他一直負責Facebook的圍棋AI相關(guān)研究,在此前的一篇知乎文章中,他提到:DeepMind不開源也不透露細節(jié),文章里面一些地方也沒有寫得很清楚。沒有第一手經(jīng)驗總不是很踏實。所以本著研究目的,我們需要復(fù)現(xiàn)一下,先有復(fù)現(xiàn),才有創(chuàng)新,這個是做研究的習慣。而且如果我們?nèi)タ?ELF OpenGo 的代碼,會發(fā)現(xiàn)其完全適用于其它方向的工作。而圍棋對我們來說,只是一個把算法和平臺做好的手段。在這一點上,花點時間把圍棋做好是值得的。

最后,關(guān)于ELF OpenGo最新訓練模型的具體數(shù)據(jù)可以閱讀原文獲取論文鏈接了解。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號