阿爾法狗今年將正式挑戰柯潔 AI引圍棋觀念轉變

作者 play 於 2017年01月06日 19:03:26

2017-01-06 09:43:01 北京青年報  

肆虐了棋壇近一周後,「Master(大師)」脫下馬甲,宣佈暫時閉關。中國最火的圍棋對戰平台弈城,在給AlphaGo保密了一周後,也放鬆了下來。這一周,AlphaGo和中國本土圍棋AI(人工智能)打擂,打出名頭,也留下被攪亂的圍棋世界;連高曉松等「圈外人」也在思索著被「大師」改變的人生。不過人生總要繼續,有消息稱,就在今年,谷歌AI會正式挑戰柯潔。

有保密沒協議

弈城CEO李哲勇把「Master」身世的秘密守了一周,但他告訴北京青年報記者,谷歌並沒有和弈城簽任何書面協議。

去年12月29日,「Master」初登弈城。令人迷惑的是,他自稱來自韓國。李哲勇介紹,這是AlphaGo開發者放的煙幕彈,不希望棋手們這麼快猜出它的來歷。「畢竟還在測試,AlphaGo團隊開始想隱藏身份,於是就托我們註冊了一個韓國號。」李哲勇說。

為了方便挑戰棋手,弈城還為初登平台的「Master」準備了九段帶P(職業)的號。李哲勇介紹,「他們團隊先找到我們的韓國合作方,想註冊個號,方便和職業棋手下棋。後來我這邊幫助註冊的。」

為什麼谷歌會選擇弈城?李哲勇說,黃士傑博士作為AlphaGo開發者之一,也是圍棋愛好者,「第一個想到我們很正常。所以這次也沒有簽什麼書面協議,就是私交不錯。只是要求別透露身份,只是約定,沒有正式協議。」

台灣出生的黃士傑博士,畢業於台灣師範大學,博士論文就是「應用於電腦圍棋之蒙地卡羅樹搜索法的新啟髮式演算法」。他本身也是業餘六段,很早就在弈城下棋。這也解釋了在與「棋聖」聶衛平對弈結束後,「Master」為何用繁體字打出「謝謝聶老師」。

有煙霧有「督戰」

一邊保守著秘密,弈城一邊為人機大戰造勢,先是在自己網站上發了含混的消息,後在圍棋貼吧裡發了含混的帖子。可隨著「Master」連戰連捷,圍棋的一切都在瞬間捲進了風暴。那一刻,谷歌創始人布林就身在北京。

這次來訪北京,布林並沒有公開自己的來意。有媒體透露,其身邊人稱他是來休假的,屬於個人性質的旅遊,結果引來了一陣調侃,「布林是不是沒看天氣預報……」

如今「Master」完成60連勝,職業六段棋手樊麾同時也是谷歌DeepMind團隊測試工程師,代表DeepMind團隊發表公告:「我們最近很努力地開發阿爾法圍棋,剛過去的幾天我們在網絡的對弈平台進行了一些非正式的快棋對局,目的是為了檢驗我們最新版本的阿爾法圍棋是否如我們的預期。」

不費「一槍一彈」,谷歌進行了對升級版AlphaGo的測試。眾多中日韓頂尖棋手帶著對圍棋的熱愛,甘心充當了免費程序測試員。不過北青報記者瞭解到,就在今年,谷歌將邀請中國圍棋第一人柯潔正式和AlphaGo進行人機大戰。

AI打擂棋手作陪

其實「Master」並非唯一「踢館」的AI。歲末年初,好幾個高水平圍棋AI現身弈城等平台。借助各自對人類棋手的勝率,AI們也分出了高下。

表現最積極的當屬日本的Ddeepzengo,至今年1月3日,已經下了超過200盤棋,輸了20盤。雖然勝多負少,但主要是勝不帶P標誌的業餘棋手,對職業棋手輸得多,還沒有世界冠軍級棋手出手測試。

騰訊野狐圍棋的「絕藝」和「刑天」作為本土AI,更加引人注目。2016年11月上線的騰訊AI「絕藝」勝了柯潔一盤,5比1勝朴廷桓,但此後高手們摸清了「絕藝」的路數,柯潔對「絕藝」的戰績達到3比1。此後「絕藝」再沒下過棋,下線研發升級去了。

一個月後,升級版本「刑天」又上線開始下棋,對柯潔戰成5比2,對朴廷桓4比1。雖然「刑天」死活還是有問題BUG(漏洞),但職業棋手感覺其實力已和去年初的AlphaGo相當。

就在職業棋手們認為找到了「刑天」的漏洞就是找到所有AI的漏洞之時,「Master」的登場打消了棋手的念頭。人類一勝難求,「Master」早早領先10多目甚至20目以上,收官時再「讓」給人類一些目數保成4目半、2目半或者半目勝。參考人類棋手的成績,AlphaGo在這場AI打擂中更勝一籌。

從挑戰到學習

AlphaGo團隊選中弈城的重要原因,是這裡聚集了世界最頂尖的棋手和最多的棋迷。雖然「Master」穿著馬甲,但柯潔第一天就猜到了真相。

李哲勇對北青報記者表示,最開始弈城是對棋手保密的,包括對柯潔,但「Master」鋒芒太露,「我們除了提供了號,其他都不管。AlphaGo是自己挑對手的,結果上線第一天就是全勝,有的棋手不服氣,再下,又被切。到第二天,所有棋手就知道肯定是機器了。」

柯潔其實第一天就知道了真相。「因為在他瞭解的範圍,沒人這麼下棋,也沒人這麼厲害,他就去問了我們總經理,跟人家說告訴我吧,我肯定保密。我們經理回復說呵呵,不能說啊,他就自己感覺到了。」李哲勇說。

因為「Master」成績太過突出,棋手早已收起昔日的矜持,排隊等著「翻牌」過招。去年首次人機大戰,柯潔曾豪言「阿爾法狗贏不了我」,這次兩敗於對手後,柯潔醉心於對手別出心裁的棋路,以至於一夜不眠。而唐韋星敗於對手後則說,「朝聞道夕死可矣。」

有敬仰有口水

60盤30秒一次的快棋對局,遠遠沒有逼出「Master」的極限,可也逼出了不少下限。一邊是對人工智能敬仰的口水,一邊是肆意踩踏職業棋手尊嚴的口水,這次人機大戰引發了別樣的風波。

比如高曉松就在微博上表示,「作為自幼學棋、崇拜國手的業餘棋手,看了Master橫掃中日韓頂尖高手的對局,難過極了。多少代大師上下求索,求道求術,全被破解。未來一個八歲少年只要一部手機就可以戰勝九段,榮譽信仰灰飛煙滅。等有一天,機器做出了所有的音樂與詩歌,我們的路也會走完。」

高曉松的微博「激怒」了唐韋星。後者回應道:「職業棋士就算下不過電腦也是你一輩子比不上的,別說手機,高考讓帶手機嗎?比賽也不會讓你帶的。真搞不懂有狗了就覺得職業棋士差的人是怎麼想的。」

某圍棋教育創始人這樣說:「頂尖職業棋手都認識到了,自己以為對的,其實都是錯的。自己以為的高明,其實都是笑談。老師,還是不懂的,最好。」

從求勝變求道

職業棋手一朝被機器打敗,弈城在考慮AI未來對自己平台的衝擊,職業棋手則開始思考,被心中只有勝率和算法的機器打敗後,是不是說明圍棋在求勝之餘也有求道之路需要探索。

高曉松的話逆耳,卻吻合專家的預言,比如圍棋比賽的網絡預選賽制將很難再搞。這只是信念危機,還有信任危機。李哲勇說:「下棋本來是公平對決,如今要是大家都不再相信對手,都猜疑對手會使用AlphaGo作弊,怎麼辦?」

好在,人工智能的衝擊也讓圍棋人想起求道之路。「當今活躍的一流棋手,幾乎都在弈城上從小練棋成長,包括柯潔,從小孩開始,就用『潛伏』這個用戶名在這上面練棋。這裡仍是棋迷們手談、心靈交流的平台,這種情感不是一場勝負可以取代的。」李哲勇說。

但求勝仍是職業棋手的終極目標。轉換思路,如今打敗了棋手的AI,也正是棋手探索圍棋未知領域的最佳助手。陳耀燁兩盤不敵「Master」後說,下了還想再下。他認為與AI過招,正是有利於打破思維定式的訓練方式,「AI錯誤更少,如果將來有單機版能用於訓練的話,以後訓練模式肯定會不一樣。越接觸AI越感到圍棋的深奧,未來提升空間很大。」

同樣樂觀的還有柯潔。他說:「人類數千年的實戰演練進化,計算機卻告訴我們人類全是錯的。我覺得,甚至沒有一個人沾到圍棋真理的邊。但我想說,從現在開始,我們棋手將結合計算機,邁進全新的領域,達到全新的境界。」面對AI來襲,擁有樂觀和開放的心態,這至少是一個好的開始。

文/本報記者褚鵬


來自: http://www.pgs2.net/modules/newbb/viewtopic.php?topic_id=1232&post_id=3139