會員登入
帳號:

密碼:

記住我



忘記密碼?

現在註冊!
圍棋資訊及轉帖

一雪被AlphaGo狠虐的「前恥」 14比1,這次人類終於贏了圍棋AI

discuss pic 2023-02-23 21:29:30

一雪被AlphaGo狠虐的「前恥」 14比1,這次人類終於贏了圍棋AI

轉自微信公眾號:CSDN 


整理 | 鄭麗媛

出品 | CSDN(ID:CSDNnews)


伴隨著近期 ChatGPT 的火爆出圈,AI 再次成為了科技圈中的爆款話題。回想上次 AI 引來如此廣泛關注,似乎還是 2016 年 AlphaGo 擊敗世界頂級棋手李世石的時候。


AlphaGo 有多強?它以 4:1 戰勝李世石,唯一輸掉的那局讓李世石成為唯一戰勝過 AlphaGo 的人類棋手,甚至讓他在 2019 年宣佈退役時仍耿耿於懷:「就算我排名第一,也會有台電腦是無法被擊敗的。隨著 AI 在圍棋比賽的登場,我意識到就算通過努力成為第一名,我也不會是最頂尖的……」


自 AlphaGo 問世後,至少在圍棋界逐漸形成了一個共識:人類是打不過 AI 的——然而,據《金融時報》最新報道,近來一名人類棋手以 14:1 的比分,全面打敗了頂級圍棋 AI 系統 KataGo,即:人類戰勝了 AI。




抓到了圍棋 AI 的弱點


一般看到這種比分差距,我們會猜測兩種可能:要麼這位人類棋手太強,要麼這個圍棋 AI 系統 KataGo 太弱。

然而:

戰勝 KataGo 的這個人,不是世界冠軍,甚至不是職業棋手,他只是一位名叫 Kellin Pelrin 的美國業餘棋手,結果與 AI 對戰的 15 場比賽中,他贏得了 14 場。

KataGo 也並不弱,它是一款很強大的開源圍棋 AI,將 AlphaGo 和 AlphaZero 技術作為開發基礎,由哈佛大學 AI 研究員 David J. Wu 所研發,曾參與第 12 屆 UEC 杯世界計算機圍棋大會並獲得第三名。


既然 Kellin Pelrin 不強,KataGo 也不弱,那麼 14:1 的巨大分差到底是怎麼來的?《金融時報》給出了答案:Kellin Pelrin 抓到了圍棋 AI 的弱點——準確來說,這個弱點是加州研究公司 FAR AI 開發的一個軟件程序發現的。

FAR AI 用這個軟件與 KataGo 下了 100 多萬盤棋,並在此過程中分析 AI 棋手的弱點,從而找到人類棋手可以利用的 「盲點」。對此,FAR AI 首席執行官 Adam Gleave 表示:「對我們來說,利用這個系統出乎意料地容易。」

針對已發現的 KataGo 弱點,Kellin Pelrin 進行了學習理解:「該軟件所揭示的獲勝策略不僅可行,而且也不是很難,差不多中等水平的棋手就可以用它來擊敗 AI。」


對圍棋有所瞭解的人都知道,對戰雙方需要在 19x19 的棋盤上交替放置黑棋和白棋,大方向就是要圍住對方的棋子。包圍範圍的或大或小,應對方式的靈活多變,注定了 AI 很難預估所有可能的棋局走向。


至於 Kellin Pelrin 採用的策略,說起來很簡單:慢慢將棋子串成一個「環形」,期間時不時落子在棋盤的其他角落以分散 AI 的注意力。Kellin Pelrin 對此評價道:「即便我幾乎都要完成那個環了,AI 機器人都沒有發現問題。但如果對方是一個人類,就很容易看出來。」


通過這種方式,Kellin Pelrin 不僅贏了 KataGo,還戰勝了另一個頂級圍棋 AI 系統 Leela Zero。



AI 無法真正深入理解圍棋?


事實上,這件事雖然乍看之下有些不可思議,但並非不能理解——早已有許多事實證明,AI 從不是「無懈可擊」。

2016 年,李世石雖以 1:4 落敗,但也確實在 AlphaGo 手中拿下一局。當時是第四局,李世石在第 78 手走了一步 AlphaGo 不曾設想的棋,似乎由此擊中了它的 Bug,導致 AlphaGo 開始出現失誤,並產生一系列崩潰反應,從而失掉了那局。

或許是從 AlphaGo 唯一輸掉的這局收穫靈感,去年 11 月幾名 AI 研究人員發表了一篇論文,主題跟此次 Kellin Pelrin 採用的策略相似:研究了一種通過利用 KataGo 盲點的對抗性技術來擊敗 KataGo 的方法,即出乎意料的棋步可以欺騙 KataGo(例如,通過首先對棋盤的一個小角落進行圍空,讓 KataGo 誤以為自己贏了),從而使其輸掉比賽。


但也正如 Kellin Pelrin 所說,這種方法能贏頂級圍棋 AI,卻連人類業餘棋手都贏不了。


對此,加州大學伯克利分校計算機科學教授 Stuart Russell 認為:「不斷發現這些頂尖圍棋 AI 的弱點,這表明了支撐當今最先進的 AI 的深度學習系統有一個根本缺陷。」


也就是說,像 AlphaGo、KataGo 等圍棋 AI 系統,哪怕其勝率優越,還是無法真正深入理解圍棋,其反饋大多基於訓練時接觸到的棋局。Stuart Russell 解釋道,這些系統只能「理解」它們過去接觸過的特定情況,但無法進行概括總結:「這再次表明,我們過於草率地將超過人類的智力水平賦予了機器。」



「AI 需要人類,而人類也需要 AI」


這則時隔七年,人類終於戰勝 AI 「一洗前恥」的新聞,引發了許多網友的關注與討論:

「它要打敗 AlphaGo 我才能相信人類戰勝 AI 了,但我對此保持懷疑…」

「這些 AI 的真正強大之處在於它們所訓練的數據,但缺乏總結意識或批判性思維。」

「這只能表明,AI 需要人類,而人類也需要 AI。」

「我想到了過度依賴 AI 系統的風險,因為它們可能都包含這類漏洞。」


一雪被AlphaGo狠虐的「前恥」 14比1,這次人類終於贏了圍棋AI恥

」 14比1,這次人類終於贏了圍棋AI

Powered by XOOPS © 2001-2020 The XOOPS Project