會員登入
帳號:

密碼:

記住我



忘記密碼?

現在註冊!
主選單


正在瀏覽:   1 名訪客






AlphaZero在1000盤對抗賽碾壓國象(西洋棋)引擎Stockfish8
#1
管理員
Benutzerinformationen

2018年12月13日 11:00 新浪體育綜合
AlphaZero碾压国象顶尖引擎Stockfish8 AlphaZero碾壓國象頂尖引擎Stockfish8

文章來源:映美杯中國國際象棋甲級聯賽

人工智能

 

本文翻譯並修改於chess.com,版權歸原作者所有

去年12月,AlphaZero的出現如同衝擊波一樣席捲全球。而就在今天,人工智能團隊DeepMind公佈了「引擎自我學習」這一項目的最新成果,結果令人震驚不已:新版本的AlphaZero以155勝,6負,839平的戰績碾壓國象頂尖引擎Stockfish8.毫無懸念地再一次證明了,AlphaZero代表了全球最強大的國際象棋水平。

不僅如此,AlphaZero在一系列讓時賽中也同樣擊敗了Stockfish8,即使是在1:10的時間賠率差距下,AlphaZero依然可以擊敗Stockfish8。根據DeepMind的說法,AlphaZero還擊敗了Stockfish9,其結果與Stockfish8基本相同,不僅如此,AlphaZero還贏得了與帶有強大開局庫的Stockfish8的比賽,添加強大開局庫毫無疑問對Stockfish的幫助是極大的,當AlphaZero執黑時,Stockfish贏得許多場勝利,但是仍不足以獲取整個對抗賽的勝利。

 

(以上為AlphaZero對陣無佈局庫和有佈局庫的Stockfish的對局結果,綠色為勝局數,紅色為負局數,圖片來源於Science雜誌)

這一結果已經由DeepMind的研究人員發表在了《科學》期刊上,並由DeepMind提供給選定的國際象棋媒體,該公司總部位於倫敦,由Alphabet所擁有。

這1000場比賽是於2018年初進行的,在比賽中,雙方的時限為每方三小時,每步棋加15秒,這一時限解決了在2017年AlphaZero與Stockfish對抗賽上的最大爭議點:即每步棋一分鐘對於Stockfish而言是處於劣勢的。(2017年AlphaZero與Stockfish對抗賽的時限為每步棋一分鐘)

而三個小時,每步棋外加15秒的時限,便不存在這樣的爭議了,因為這一時限可以給任何引擎足夠的思考時間,可以讓引擎充分發揮出自己的水平,在讓時賽中,即使是1:10的時間賠率,AlphaZero依然佔有優勢,當時間賠率達到1:30時,Stockfish才佔據上風。

 

AlphaZero讓時賽的結果表明:它不僅比任何傳統引擎都要強大的多,並且使用了更有效的搜索好棋的方法,根據DeepMind的說法,AlphaZero使用Monte Carlo樹進行搜索,每秒可以檢索60000個局面。

 

(AlphaZero如何處理局面,搜索招法的圖表分析,圖片來源於Science雜誌)

根據DeepMind的說法,AlphaZero從遊戲規則開始學棋,使用機器自學技術不斷更新自己的」神經網絡「,5000個TPU(Google的張量處理單元)被用於生成第一組」自我對弈「,然後使用16個TPU訓練」神經網絡「。

其總訓練時間是9個小時,從遊戲規則開始,據DeepMind的說法,新版本的AlphaZero僅用了4個小時就超過了Stockfish,9個小時後,它便遠超世界上所有的傳統引擎。

在對抗賽中,Stockfish使用了44個CPU,AlphaZero使用了一台具有4個TPU和44個CPU的機器,Stockfish的散列大小為32GB,並且使用了」syzygy endgame database「。

(本文轉自:「kb的國象天堂」微信公眾號)


12/13 16:13
生成PDF文件 列印







可以查看文章。
不可發文。
不可回復。
不可編輯自己的文章。
不可刪除自己的文章。
不可發起投票調查。
不可在投票調查中投票。
不可上傳附件。
不可不經審核直接發文。
不可使用主題類別。
不可使用HTML語法。
不可使用簽名檔。

[高級搜索]


Powered by XOOPS © 2001-2015 The XOOPS Project