0 - CBB 討論區 - 查看所有文章 - PGS圍棋站
 
會員登入
帳號:

密碼:

記住我



忘記密碼?

現在註冊!
主選單

PGS圍棋站 討論區


_MD_FORUMHOME » 查看所有文章 (play)


(1) 2 3 4 ... 576 »


回復: 第十屆棋王賽 ( 2017年 9/4 起 冠軍 120萬 )
#1
管理員
Benutzerinformationen
第一輪10月19日 (四)
周俊勳 負 陳祈睿,林君諺勝林士勛,林立祥勝 陳詩淵,林書陽勝 簡靖庭


累積成績

周俊勳 0-1
林君諺 1-0
林立祥 1-0
林書陽 1-0
簡靖庭 0-1
陳詩淵 0-1
林士勛 0-1
陳祈睿 1-0




循環圈賽事詳細對陣

第一輪10月19日 (四)
周俊勳 負 陳祈睿,林君諺勝林士勛,林立祥勝 陳詩淵,林書陽勝 簡靖庭

第二輪10月23日 (一)
周俊勳vs林士勛,林君諺vs簡靖庭,林立祥vs林書陽,陳詩淵vs陳祈睿

第三輪10月26日 (四)
周俊勳vs陳詩淵,林君諺vs林立祥,林書陽vs陳祈睿,簡靖庭vs林士勛

第四輪10月30日 (一)
周俊勳vs簡靖庭,林君諺vs陳祈睿,林立祥vs林士勛,林書陽vs陳詩淵

第五輪11月02日 (四)
周俊勳vs林書陽,林君諺vs陳詩淵,林立祥vs簡靖庭,林士勛vs陳祈睿

第六輪11月06日 (一)
周俊勳vs林立祥,林君諺vs林書陽,簡靖庭vs陳祈睿,陳詩淵vs林士勛

第七輪11月09日 (四)
周俊勳vs林君諺,林立祥vs陳祈睿,林書陽vs林士勛,簡靖庭vs陳詩淵

Ystrday 17:57
回頂部


阿爾法圍棋進化到“零” 自學三天勝人千年
#2
管理員
Benutzerinformationen


2017年10月19日10:06 新浪體育

Open in new window

AlphaGo Zero

文章來源: 財新網作者:王爍

今天(10月19日)凌晨,谷歌旗下Deepmind團隊在《自然》雜誌發表人工智能界期待已久的論文《無須人類知識掌握圍棋》(Mastering the game of go without human knowledge),印證了一個人們已經猜到的事實:今天的阿爾法圍棋(AlphaGo)已經完全不是人了。

阿爾法圍棋於2015年10月面世,擊敗歐洲冠軍樊麾;2016年3月擊敗人類頂尖棋手之一李世石;2017年元旦前後在網絡上化名大師(Master),60比0完敗前來車輪戰的人類一流棋手;2017年5月在烏鎮3比0戰勝當下人類最強者柯潔。

隨後,Deepmind團隊放出阿爾法圍棋自戰50局,人類陷入迷茫,完全看不懂。讀完論文,就明白了為什麼。

阿爾法演化得太快。

阿爾法樊麾版和李世石版是阿爾法圍棋1.0版。它用了三種算法,策略網絡加價值網絡加蒙特卡洛樹搜索,分別對應於人類的棋步選擇、形勢判斷和深算;訓練時,阿爾法1.0版走的是監督學習+強化學習路線,所謂監督學習,就是用人類的棋譜餵牠,在此基礎上,自我對弈,強化學習。阿爾法以人為師,學了半年,戰勝人類。

到了阿爾法大師,已進化到阿爾法1.5版。大師仍然以人為師,但不再是三種算法並行,而是化歸為一種創新的自我強化學習算法。如果我沒讀錯論文的話,大體是自我對弈,用蒙特卡洛樹搜索尋找最優下法,將輸出結果作為輸入值重新跑算法,如是反复迭代。

大師很強,但還是人的圍棋。今天面世的論文則介紹了非人的圍棋,阿爾法圍棋2.0。除了使用新的自我強化學習算法,它完全放棄監督學習,而是直接從圍棋規則開始,自我對弈,跑強化學習算法。

論文解釋,在現實生活中,專業數據集往往昂貴或不可得,甚至可能給機器增加一層“天花板”。完全讓機器自學,才有可能讓它超越人類的局限性,發現前所未見的新方法。

這個阿爾法從零開始,所以,它的名字叫作零(Zero)。

谷歌用這個名字告訴人類,零需要的人類知識是零。它完全沒有向人學棋,通過自我對弈學習。學到第36個小時的時候,已經超過李世石版;學過三天,自我對弈490萬局,學成出關。

阿爾法零與李世石版大戰100局,100比0。與戰績一邊倒相應的是算力消耗的一邊倒:阿爾法零是單機版,只用4個TPU,李世石版使用了176個GPU(圖形處理器)和48個TPU,而且學習時間是好幾個月。

算法優化提升效率太多,大量減少對算力的要求。這篇論文因為提交時間較早沒來得及提到,但我猜在烏鎮戰勝柯潔的那個阿爾法,肯定已是零——這次只帶一台機器過來就可以了。

有意思的是,阿爾法零在預測職業棋手的下一步上,並不如李世石版精確,這說明零下的棋跟人下的棋已經不是同一種圍棋:它不需要預知人類的下一步,因為人類下得有點差。

Open in new window


上圖是零的成長圖,中間那條有從0到72數值的是時間線,對應著從創世到72小時。

從時間線引出來的虛線,指向與相對應的零下的棋。作為一個人類棋手,我看著很感慨:從零開始,它穩定、迅速地變強。

3小時,零在亂下。

10小時,發現簡單定式。

16小時,發現小雪崩定式。

19小時,發現死活、厚勢與實地的邏輯。

24小時,發現小目一間高掛定式。

36小時,也就是超越李世石版的時候,發現星位一間夾點角定式。

55小時,發現非人類定式。

72小時,出關。

人類學習的時間線是什麼樣的呢?今天的世界冠軍級棋手,5歲學棋,15歲出關,20歲前拿冠軍,否則終身無望。

人類學棋十幾年,不如阿爾法零學3天。

阿爾法零出關後,在內部測試中,Deepmind團隊用更大的神經網絡,更長的時間(40天),更多的自我對弈(2900萬局),訓練了一個加強版的阿爾法零,與阿爾法大師對戰100番棋,89比11勝出。

阿爾法圍棋各個版本的Elo積分如下,:

阿爾法零(加強版的AlphaGo Zero): 5182

擊敗當下第一人柯潔

阿爾法大師(AlphaGo Master):4858

60比0擊敗人類一流棋手團

阿爾法李世石(AlphaGo Lee): 3739

擊敗世界冠軍級棋手李世石

阿爾法樊麾(AlphaGo Fan): 3144

擊敗歐洲冠軍樊麾

附帶解開了一個謎。烏鎮大戰時,Deepmind團隊表示當時的阿爾法圍棋能讓一年前擊敗李世石的那個版本三個子。棋界雖早已服膺阿爾法的棋力,但仍然認為讓三個子是天文數字,不可能。現在,從積分上看,阿爾法零讓李世石版三個子當無問題。

這當然不是說柯潔能讓李世石三個子,而是說烏鎮大戰雖然表面激烈但柯潔沒有一點機會,一切盡在阿爾法零的算中,真正是深不可測。

也有個好消息,很可能我們已經看到圍棋之神的輪廓。它長得跟阿爾法零差不多。

阿爾法零與阿爾法大師算法相同,區別只在於一個自已學,一個向人類學,雖然兩者對戰中零以大比分壓倒大師,但也不是沒有勝負。89比11的比分說明兩點:

第一,正如論文結論所說,哪怕是在圍棋這類極有挑戰性的領域,純粹強化學習路徑完全可行。只需知道規則,無需預備知識,沒有先例,不用人類指導,仍能通過訓練達到超人水平。人類下了千年圍棋,累積了數百萬張棋譜,集體智慧凝聚的知識,在幾天之間,就被阿爾法零重新發現,還找到了人類聞所未聞的新策略,為這最古老的遊戲注入了新內涵。

第二,即使如此,阿爾法零與阿爾法大師仍是有勝負的,零強過大師,但邊際改進已迅速下降。圍棋之神的Elo積分,我大膽猜測,6000分打住了。

這個判斷對不對?只能等量子計算機出關以後能不能再度刷新認知了。量子計算機利用量子力學的態疊加原理,算力遠遠勝過傳統計算機。全世界走在最前面的也是谷歌的量子計算機,使用22位的量子位(quabits)計算。


Ystrday 15:42
回頂部


圍棋界霸主換人當?新AI軟體靠自學就能戰勝AlphaGo
#3
管理員
Benutzerinformationen

https://media.bnextmedia.com.tw/image/ ... /img-1476691546-17728.png);">
比賽直播螢幕截圖

Google旗下所屬的AI實驗室DeepMind,繼開發出AlphaGo打敗世界圍棋冠軍後,再宣布進階版的新軟體AlphaGo,宣稱比前一代更強、更聰明。

人工智慧(AI)圍棋軟體AlphaGo與圍棋世界冠軍李世乭激烈的大戰似乎還歷歷在目,Google旗下AI實驗室DeepMind又表示開發出更加強大的軟體,稱作AlphaGo Zero。

不需額外輸入資料,AlphaGo Zero靠自學

一般的人工智慧應用,都需要依靠事前輸入的大量資料來學習、訓練技能,舉例來說,Alpha Go就先透過線上圍棋社群中16萬筆業餘遊戲紀錄,來養成它的圍棋技能,之後再透過不斷與真人對戰,增強自己。

但是,這次的AlphaGo Zero不一樣,之所以有「Zero(零)」字樣,就是因為它完全不需要依靠人類的紀錄數據學習技能,DeepMind僅僅輸入圍棋的規則,AlphaGo Zero就會開始與自己下棋,每次優勝,這筆資料就會被輸入系統,藉此學習。

在這樣自我學習40天、對戰2900萬次之後,AlphaGo Zero勝戰原版AlphaGo的機率就已經達到90%,這樣的能力「能夠讓AlphaGo Zero成為圍棋歷史上最強大的玩家。」DeepMind說道。

此外,不依靠人類的經驗數據來學習技能,反而能讓電腦軟體突破人類知識的限制,找出新的遊戲策略與技巧,這都讓AlphaGo Zero較前一代更強大。

動態圖表顯示AlphaGo Zero如何靠自我對戰與學習,超過前一代AlphaGo的圍棋能力。DeepMind

人類仍有超越AI的思考能力

AlphaGo Zero的背後技術設計,無疑簡潔有力,然而這項新技術,卻也展現人工智慧的限制。

人工智慧之所以能夠展現技能,是因為電腦在做決策之前,會先搜尋、列出幾項決策的可能對應結果,再由此中選出最好的選擇。

然而,面對複雜的問題,我們需要思考、尋求因果,並思考未來後果;電腦能夠在既定規則下的問題思考未來,但面對現實世界中缺乏規則的決策,人類的思考能力現在仍無法被電腦取代。

DeepMind希望AlphaGo Zero在圍棋界,能成為一個新的靈感來源,給予新的遊戲策略;進一步,他們希望這項AI技術能夠被用在新藥開發、量子化學、材料設計等領域,用來發現、解析複雜的大量數據資料。

資料來源:The VergeWired

40
在自我學習40天、對戰2900萬次之後,AlphaGo Zero勝戰原版AlphaGo的機率就已經達到90%。

Ystrday 13:54
回頂部


回復: 圍棋AI 風雲 (匯整)
#4
管理員
Benutzerinformationen

 

Alphago zero (阿法元) 是說不靠人類棋譜 完全自學 .. 40天後就成長到 可 虐殺 master 的水平

 

沒有自動替代文字。

 



Ystrday 13:50
回頂部


回復: 圍棋AI 風雲 (匯整)
#5
管理員
Benutzerinformationen

[人氣對局]

逝去日子零封韓國第一人 秀芝支持率超低慘遭碾壓

  • 2017-10-18 21:11:26|曲江|0
弈城圍棋訊 10月18日晚,最近弈城最火的人氣ID「逝去日子」在國際高手房與韓國第一人XIUZHI(P)大戰兩局,結果逝去日子兩戰全勝,零封XIUZHI(P)。
逝去日子執黑中盤勝XIUZHI(P)
晚上18點,兩人的對局開始,這也是雙方的首次交手,由逝去日子執黑先行。雙方的交鋒從棋盤下方開始,XIUZHI(P)的白陣被黑方分頭突入,而當白想纏繞攻擊時,逝去日子處理得當,先把右邊一塊做活,然後棄掉下面三子,順勢把左下邊走向中腹,這樣黑不僅兩塊各自做活,而且還在中腹形成一定的勢力。當101把左上一帶大空合圍時,逝去日子已經取得了絕對優勢。雖然後面XIUZHI(P)竭力攪局,但當黑在右邊二路潛入收空時,白敗勢已定,至197手,逝去日子中盤獲勝。
由於棋局過早地失去了懸念,所以關於逝去日子身份的話題再次被棋友熱議,有的說他是當年的「鈍刀」錢宇平,還有的說他是「七小龍」之首的邵煒剛,甚至還有的棋友腦洞大開,說他是「涅槃重生的老聶(衛平)」,雖然這些說法大都是開玩笑的成分居多,但大家還是興致勃勃議論紛紛。
逝去日子執白中盤勝XIUZHI(P)
不服氣的XIUZHI(P)繼續邀戰,逝去日子也欣然應戰。雙方佈局至第50手,系統已經判斷執白的逝去日子盤面略優了。對於逝去日子執白的時候在序盤至中盤階段不知不覺就反先的情況,現在大家幾乎已習以為常。接下來逝去日子再掏掉黑右下角,打破實地平衡。此時XIUZHI(P)只有強攻右上一塊白棋才能爭勝,但逝去日子卻輕靈轉身,棄掉右邊十幾目地,在中間築起厚勢,XIUZHI(P)只好再破中腹,結果在局部的對殺中形成劫爭。
這個劫爭看似雙方都很重,但是逝去日子卻是「項莊舞劍意在沛公」,藉著劫爭走厚外圍,然後對下面的黑棋痛下殺手。XIUZHI(P)雖仍能勉強做劫頑抗,但白方卻有一枚絕佳的本身劫材。隨後逝去日子消劫滅掉下方黑棋,XIUZHI(P)則在中間提掉四子並救回自己七子。如果從XIUZHI(P)衝擊右上白棋到現在劫爭結束算一個大轉換的話,雙方目數得失其實差不多,但由於之前白實地領先甚多,黑棋已難以為繼。至180手XIUZHI(P)投子認負,逝去日子對XIUZHI(P)兩戰全勝,零封對手。
這兩局八個區間,XIUZHI(P)全被弈城棋友押成「肥雞」,尤其是第二局第四區間,XIUZHI(P)的支持率只有18%,賠率高達5.5倍,因此棋友「湘北狼」感歎地說:「地球第二人,這賠率……」而更多的人則是對逝去日子的棋力表示驚歎,棋友「怡蕊」一句話對逝去日子做了總結:「白(逝去日子)是賽特務超秀芝。」(零下一段)

Ystrday 11:20
回頂部


第十屆棋王循環圈棋士專訪系列-陳祈睿:屢仆屢起的小將
#6
管理員
Benutzerinformationen

 

轉自海峰棋院 http://www.haifong.org/?p=18204


獲得世界兒童賽冠軍的陳祈睿

世界冠軍
2012年有個新聞出現,陳祈睿6段於定段前在韓華生命杯世界兒童國手戰奪冠。
這是繼2008年簡立辰6段(當時)於國務總理盃奪冠後,再次有臺灣棋手於國際重大業餘賽事中奪冠,消息傳回台灣之時,關注度卻沒想像中的高,原因是一個「業餘」又是「兒童」的比賽,總讓普羅大眾覺得實力不如職業高手;但歷屆奪冠選手不乏現在的頂尖棋士,如:黨毅飛、羅玄、李東勳、申真諝和申旻埈。他們已經驰骋在國際職業賽場中,甚至有幾位選手已獲得世界冠軍。

前11屆於世界兒童國手戰奪冠的棋士們,棋友們認識幾個呢?

同樣的,以陳祈睿的實力自然也在國際賽事上有所斬獲。2015年第2屆夢百合盃國際統合預選賽陳祈睿勝喬智健打入本賽,2017年第22期三星火災盃世界圍棋大師賽國際統合預選賽打入決賽。雖然與上述所列棋手相比,星度略有不足,但陳祈睿已默默定下世界賽都要打入32強的目標,激勵著自己。

陳祈睿打入世界賽本賽

個性隨和
相同場域中容易遇到有共同性質的朋友,圍棋圈也不例外,有比賽自然就有對手,每局棋皆需兩人才能構成,為此棋士們通常以棋會友,棋友也喜歡面對面的手談,賽後還可以覆盤檢討,延續著已結束的棋局,開啟另一種形式的交流。

職業棋手自然也不例外,除了覆盤甚至會擺過去的棋局與他人一同檢討。陳祈睿個性不同於一般棋士的嚴謹,平易近人,無論是天王棋手、菁英棋士或是新銳棋手都會找陳祈睿一同研究。陳祈睿流露出大而化之的態度,讓我們平常不易看見陳祈睿因輸棋後的痛苦。大家當然十分好奇陳祈睿棋涯中最痛苦的是哪盤棋呢?答案是去年棋王循環圈最後一盤與賴均輔二段的對局,當時陳祈睿的心態與棋的內容都不好,輸掉了這盤棋,也失去保留循環圈的資格。為此,陳祈睿難過了許久、許久。

陳祈睿對局後的反省

循環圈的常客
如同一般戲碼,超級新銳一但進入職業的世界後,憑著這股銳氣成績總會爆發。陳祈睿2013定段後,同年昇二段,次年三段。入段的第一年以12歲之齡打入天元循環圈,也創下天元循環圈最年少的紀錄,之後數年成績相當穩定各大賽循環圈都能看到他的身影。陳祈睿定段以來共有14次循環圈的機會,有8次打進去,比例很高,這也表示他具備臺灣一流的水平,無庸置疑;但奇怪的是,這8次居然皆未能獲得保留(第12屆國手原本可加賽,因取消循環圈而未進行),進入循環圈就疲軟的狀態,也讓人懷疑到底是怎麼了?

難道每次進循環圈都要抽籤?

陳祈睿四段歷屆循環圈成績

比賽名 舉辦年 順位 備註
第12屆天元 2013 0 7 [第八位]
第7屆棋王 2014 4 3 [第五位] 加賽負周俊勳、林君諺
第14屆天元 2015 4 3 [第五位] 加賽負楊博崴
第8屆棋王 2015 1 6 [第八位]
第15屆天元 2016 4 3 [第五位]  順位低
第9屆棋王 2016 3 4 [第五位]
第12屆國手 2016 4 3 [四或五] 因次年循環圈取消,未加賽
第10屆棋王 2017 ? ? [?]

從圖表中清楚可見,歷屆成績最好即4勝,但加賽皆落敗,加上新入順位又低,導致沒有一次能獲得保留(前四名),這些過去的包袱也讓陳祈睿壓力有點大,甚至開始沒信心。尤其對到同是本屆循環圈內的林立祥七段就勝率較低,而林士勛六段就堪稱陳祈睿的苦手,兩人對戰紀錄是1:9,陳祈睿一面倒的落後;但陳祈睿也不是沒有優勢,與其他棋手不同,他是循環圈內少數能對王元均棋王取得對戰優勢的,近兩年對戰以4:1領先。

2016年新人王陳祈睿

陳祈睿的實力早就毋庸置疑,2016年奪下新人王,獲得人生第一冠。被問到有什麼目標時,陳祈睿顯得有點保守,當然他也想挑戰,但本屆棋王循環圈的目標就是先保留,一步一步前進,慢慢累積實力後明年在來爭挑戰權。自評自己今年重大比賽皆表現不佳,上半年的成績也不好,下半年目前回穩不少。國際賽方面:三星盃差一步進本賽,對陳祈睿來說,沒打進世界32強就是失敗。

陳祈睿平常的訓練是打譜,比較少下網棋,通常都只在線上看高手下網棋,也會作一些詰棋。明年的目標也相當簡單,國際賽要通過預選打入本賽,棋王、天元雙循環圈,以及其他賽事的冠亞軍。

調整腳步,邁開步伐向前衝

年輕沒有失敗
拿破崙說:「光榮的成功不在於永不失敗,而在於屢仆屢起。」第十屆棋王賽循環圈,陳祈睿正重新出發著,向其他棋手發起衝擊。


Ystrday 0:57
回頂部


這個圍棋新聞人名翻譯的實在很 xxx
#7
管理員
Benutzerinformationen

 

 壟潔 (柯潔) 、鬍子揚(胡子揚)  

用自動繁簡翻譯有時還是要人工校正一下 ~~  但我用的軟體還沒把柯潔翻成壟潔過。

 

沒有自動替代文字。


10/18 23:34
回頂部



(1) 2 3 4 ... 576 »




Powered by XOOPS © 2001-2015 The XOOPS Project