會員登入
帳號:

密碼:

記住我



忘記密碼?

現在註冊!
主選單


正在瀏覽:   1 名訪客






AlphaGo為何缺席計算機圍棋賽 或已是不同物種
#1
管理員
Benutzerinformationen

2017年03月19日15:54 新浪體育 微博
人機大戰第一季的盛況還歷歷在目

3月19日,UEC杯世界圍棋計算機大賽在日本結束,中國的圍棋程序絕藝擊敗日本的DeepZenGo,取得冠軍。這次比賽其實也邀請了AlphaGo,但被他們拒絕了。參賽的圍棋程序大都是學習2016年DeepMind的那篇論文,而現在的AlphaGo又再度進化升級,成為更為強大的「Master」了。與參賽的圍棋程序相比,現在的AlphaGo可能已經是不同「物種」了,自然沒必要參賽。

賽制並不完全「公平」

以往的UEC杯世界圍棋計算機大賽並不廣為人知,今年之所以備受關注,主要是兩個參賽程序的,日本的DeepZenGo和中國的絕藝。前者馬上要和羋昱廷、朴廷桓、井山裕太進行世界圍棋大賽,後者則一直在對弈網站上測試,積累了相當的人氣。

比賽的用時是每方30分鐘,平均下來20秒左右就要落子,參賽程序的計算能力顯然對比賽成績有著很大的影響。比賽並不是所有的程序都使用統一的硬件配置,而是各自通過手裡的筆記本電腦,把比賽數據發送到各自的服務器計算平台上完成。這也是為什麼18日現場斷網之後,比賽不得不暫停的原因。

因断网而暂停的比赛因斷網而暫停的比賽

應用了深度學習技術的圍棋程序,對局時策略網絡和價值網絡同時工作,還要配備強大GPU等計算資源。雖然計算資源堆積到一定程度之後能起到的提升效果有限,但在UEC的快棋賽制裡,計算資源上的差別還是很有影響的。

DeepZenGo是由日本最大的視頻網站作為技術支持,而絕藝的背景是騰訊,兩者在計算資源上的優勢是顯而易見的。據國內一位研究圍棋AI的同學介紹,絕藝能夠調用的計算資源大到無法想像,畢竟中國是目前超算能力最強的國家。

所以,絕藝和DeepZenGo一路過關斬將,沒有遭遇什麼抵抗就打進了決賽。兩者之間的對決才是真正意義上的戰鬥。

DeepZenGo的「離奇」失誤

(這段內容是絕藝和ZEN的決賽棋譜分析,如果你不會下棋,可以略過,大致意思是,ZEN在局面不錯的情況下,因為計算上的失誤被絕藝逆轉勝了。)

決賽DeepZenGo執黑先行,右下角黑棋的死活是這盤棋優劣的關鍵。但絕藝和DeepZenGo後來都沒有在右下角走棋,看來是對此有一致的判斷,黑棋是活的(如果某方認為黑角會死,肯定早就脫先搶著走了)。右下角的變化比較複雜,這裡就先不做討論了。

图1圖1

圖1:棋局進行到中盤階段,黑棋圍棋上邊大空,判斷下形勢,黑棋要稍佔上風。

图2圖2

圖2:「絕藝」在黑棋上邊空裡行棋,DeepZenGo的應對很成問題,白1斷的時候,黑2虎效果比實戰要好不少,更關鍵的時候,白3頂的時候,黑棋明明可有在4位扳,這樣沒什麼棋。

图3圖3

圖3:然而實戰DeepZenGo卻配合絕藝,在黑棋空裡出棋了……絕藝逆轉獲勝!

這盤棋DeepZenGo和絕藝到底使用了多大的計算資源我們不得而知,但很明顯,這樣的計算能力,DeepZenGo想在後天與人類世界冠軍的對抗中佔到上風,幾乎是不可能的。現在已經不是一年前了,人類棋手們已經對圍棋人工智能不再陌生。

與現在的AlphaGo可能不是同一「物種」

絕藝、DeepZenGo,還有此前新浪棋牌報道過的 「麗拉」,都是受到2016年DeepMind在《自然》雜誌上發表的關於AlphaGo論文啟發,進而發展成現在的圍棋人工智能的。從某種意義上講,它們都是去年那個AlphaGo的跟隨者。從這次世界計算機大賽的棋譜體現出的水平來看,他們距離去年擊敗李世石的那一版AlphaGo似乎還有一定的差距。

改变了围棋界的论文改變了圍棋界的論文

這個差距一方面來自於,當時AlphaGo與李世石下的是慢棋,計算時間比這次要長;另外一方面可能是谷歌在深度學習技術應用上的優勢所致。

不過尤其要注意的是,現在這些圍棋程序對比的對象還只是2016年與李世石大戰的AlphaGo,現在的AlphaGo(或者說MAster)究竟進化到什麼程度我們並不知道。

DeepMind在公佈科學成果上是很謹慎的。去年人機大戰之前他們說AlphaGo通過自我對弈,取得了巨大的進步,所以才有信心挑戰李世石。當時不少人對此嗤之以鼻,結果被4比1的比分打了臉。

樊麾微博截图樊麾微博截圖

2016年11月的時候,AlphaGo團隊的發言人樊麾通過微博宣佈:「我們很高興向大家宣佈,AlphaGo的棋力在已過半年有巨大的進步,將在2017年初復出下棋。我們團隊會在近期內公佈更多訊息。」這個「巨大進步」耐人尋味,AlphaGo的研究又取得了怎樣的進展呢?之後Master在網上的60盤快棋測試,讓我們驚鴻一瞥。計算時間極短、完美的局面掌控、精準的局部戰鬥,這些細節都告訴著我們,現在的AlphaGo或者說Master,已經和一年前的它完全不同了,甚至可能已經進化到了一個更為先進的階段。

上一次AlphaGo公佈研究結果,改變了整個圍棋人工智能領域,為圍棋界打開了一道通往未來的大門。不久前,哈薩比斯說:「2017年將是AlphaGo與棋界興奮的一年」,這次他們會帶來什麼樣的驚喜呢?

哈萨比斯和李世石哈薩比斯和李世石

(周遊)


3/20 12:00
生成PDF文件 列印







可以查看文章。
不可發文。
不可回復。
不可編輯自己的文章。
不可刪除自己的文章。
不可發起投票調查。
不可在投票調查中投票。
不可上傳附件。
不可不經審核直接發文。
不可使用主題類別。
不可使用HTML語法。
不可使用簽名檔。

[高級搜索]


Powered by XOOPS © 2001-2015 The XOOPS Project