人類多余嗎?AI想超越人類可沒那么容易
今年五月份舉行的烏鎮(zhèn)圍棋峰會上,AlphaGo擊敗柯潔之后可以說在圍棋界里已是“獨孤求敗”的境界了,幾乎無人是其對手。人們在贊賞的同時,也想看到是否會出現(xiàn)一個對手,能夠將ALphaGo拉下馬。
事實就是這樣,越想著什么越會發(fā)生什么。ALphaGo終于遇到了自己的對手,這個對手甚至以摧枯拉朽之勢擊敗了ALphaGo。
就在上周,據(jù)外媒報道,英國DeepMind團隊在《自然》雜志上發(fā)表了相關論文,介紹了新一代的圍棋AI:ALphaGo Zero。使用了強化學習技術的ALphaGo Zero可以通過自我對弈進行訓練,棋力大幅度增長,輕輕松松擊敗了曾經不可一世的ALphaGo。人們再次被震驚了,就連柯潔都發(fā)出了“人類多余”的感嘆。
圖片源自微博
ALphaGo Zero到底是何方神圣?
可能有的人認為,這沒有什么特別的。ALphaGo Zero是ALphaGo的強化版,比ALphaGo經歷了更多的數(shù)據(jù)演練,打敗ALphaGo很正常。然而事實并不是這么簡單。
在過去,AlphaGo都是使用專業(yè)人類棋手的對局數(shù)據(jù)來進行訓練,可以說是人類棋手的指導下,讓它一步步的成長起來。而ALphaGo Zero完全不同,它采用了強化學習技術,從隨機對局開始,不依靠任何人類專家的對局數(shù)據(jù)或者人工監(jiān)管,而是讓其通過自我對弈來提升棋藝。
據(jù)了解,ALphaGo Zero經過3天的訓練,就已經可以擊敗AlphaGo Lee(去年擊敗韓國頂尖棋手李世石的系統(tǒng)),比分為100比0。經歷40天訓練后,它總計運行了大約2900萬次自我對弈,又擊敗AlphaGo Master(今年擊敗世界冠軍柯潔的系統(tǒng)),且比分為89比11。要是說ALphaGo對陣人類只是略勝一籌,那對陣ALphaGoZero簡直就是被碾壓的局面。
DeepMind團隊表示,ALphaGo Zero之所以那么強,原因在于它采取的強化學習技術。他們發(fā)現(xiàn)AlphaGo Zero自我對弈僅幾十天,就掌握了人類幾百年來來研究出來的圍棋技術。由于整個對弈過程沒有采用人類的數(shù)據(jù),因此ALphaGo Zero的棋路獨特,不再拘泥于人類現(xiàn)有的圍棋理論。
何謂強化學習技術?
到底什么是強化學習技術呢?簡單地說,強化學習就是讓AI從中學習到能夠獲得最大回報的策略。AlphaGo Zero的強化學習主要包含兩個部分,蒙特卡洛樹搜索算法與神經網絡算法。
在這兩種算法中,神經網絡算法可根據(jù)當前棋面形勢給出落子方案,以及預測當前形勢下哪一方的贏面較大;蒙特卡洛樹搜索算法則可以看成是一個對于當前落子步法的評價和改進工具,它能夠模擬出AlphaGo Zero將棋子落在哪些地方可以獲得更高的勝率。
AlphaGo Zero的自我強化學習,圖片源自Nature
假如AlphaGo Zero的神經網絡算法計算出的落子方案與蒙特卡洛樹搜索算法輸出的結果越接近,則勝率越大,即回報越高。因此,每落一顆子,AlphaGo Zero都要優(yōu)化神經網絡算法中的參數(shù),使其計算出的落子方案更接近蒙特卡洛樹搜索算法的結果,同時盡量減少勝者預測的偏差。
剛開始,AlphaGo Zero的神經網絡完全不懂圍棋,只能盲目落子。但經歷無數(shù)盤自我對弈后,AlphaGo Zero終于從圍棋菜鳥成長為了一代棋神。
AI雖強,但超越人類可沒那么容易
我們可以看到,ALphaGo Zero與它的前任相比,技術上實現(xiàn)了質的飛躍。DeepMind團隊也表示,希望通過培養(yǎng)AI自主學習的能力,來解決更多其他領域目前無法解決的棘手問題。但是仍有很多人對于AlphaGo Zero的這種進化表示了深切的擔憂。
美國加州伯克利大學博士@Ent_evo就專門針對ALphaGo Zero發(fā)表了一篇博文,在文中評論道:這對人類來說是個很大的打擊。當年AlphaGo至少還學習了大量的人類經驗,但是AlphaGo Zero根本就不需要人類棋手這么多年的積累,人類經驗是好是壞,對AI而言完全無關,這是所有AI末世中最令人恐懼的一個場景。
這不禁讓人想起著名物理學家斯蒂芬·霍金在2017全球移動互聯(lián)網大會(GMIC)發(fā)表的演講。他表示,人工智能的崛起很有可能終結人類文明。
但是也有不少業(yè)內人士對此表示不用擔心。新松機器人總裁曲道奎在接受媒體采訪時表示,Zero的分量被夸大了,這次突破只能算人工智能在圍棋領域的勝利,但要完成超越人類其他行業(yè)的水平卻為時尚早。就技術層面而言,Zero解決了圍棋問題,但更多的問題比如自然語言理解、圖像理解、推理等問題仍然存在。
在筆者看來,ALphaGo Zero的誕生帶來了許多積極意義。它從零開始,證明了“算法優(yōu)先于數(shù)據(jù)”這條長期以來一直爭論的觀點;它能夠擺脫對人類的依賴,不需要人類給出樣本數(shù)據(jù),這為廣泛的行業(yè)應用提供了更多可能。
雖然人工智能如此強大,但是“人類多余”的言論還是說的過于嚴重了。即使ALphaGo Zero是通過自我學習進行成長,但是它依然沒有屬于自己的思維能力。歸根結底,AI也只不過是由人類為了某些需求而用技術加持的一個工具罷了。這個工具雖然強大,但超越人類可沒那么容易。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月20日火熱報名中>> 2024 智能家居出海論壇
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網產業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【在線會議】多物理場仿真助跑新能源汽車
推薦專題
-
10 臺積電7nm停供中國大陸
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市