會員登入
帳號:

密碼:

記住我



忘記密碼?

現在註冊!
主選單


正在瀏覽:   1 名訪客






「全能棋王」AlphaZero的啟示 直覺如何戰勝邏輯
#1
管理員
Benutzerinformationen

「全能棋王」AlphaZero的啟示 直覺如何戰勝邏輯

2017年12月18日13:52 新浪綜合
國際象棋

來源:新浪科技  作者:DeepTech

現代文明和科技已經使得我們的直覺不斷退化。絕大多數人都沒有意識到直覺的價值甚至沒有意識到它的存在。作為複雜計算的基礎,直覺是一種很容易被忽視的非常規方法。這種非常規性使得許多研究人員忽視它的潛力。

本文引用地址:http://www.eepw.com.cn/article/201712/373152.htm

我在人工智能領域所做的工作圍繞「先進的認知機器將使用直覺作為其智力基礎」這一想法。我們人類的思想為一般化的智力提供了充足的證據。人類本質上是直覺機器,而我們理性(和自覺)的自我只是基於直覺的機器之上的一個模擬。這與笛卡爾的名言「我思故我在」形成鮮明的對比,意味著我們的理性思維就是把我們與其他所有生物區分開的東西。

我們因此在認知上有了偏見,要求技術和方法由邏輯機器驅動。這就是 Good Old Fashioned AI (GOFAI) 在過去幾十年間失敗的原因,它從一開始就試圖通過邏輯範式來解決智力問題。

一個關於直覺的機器的反直覺的預想就是「邏輯思維如何從直覺機器中產生呢?」自 2012 年以來,我們已經見證了深度學習技術令以難以置信的進步。深度學習網絡就是直覺機器。深度學習網絡通過歸納來進行推理或者作出預測。深度學習系統已經能夠執行通常保留給生物大腦的任務了。已知對於傳統計算來說難以進行的任務,例如面部和語音識別,可以由這些機器以超越人類的水平執行。

然而,深度學習網絡無法執行長除法等邏輯任務。人們不應該指望能夠教導一個動物(比如你的寵物狗)加減,更不用說乘法。然而,人類的大腦卻可以執行各類這樣的邏輯問題。我們不得不問,洞穴人能做乘法嗎?我們是天生就具備先進的邏輯認知能力,還是說那是我們作為先進文明的結果而學到的能力?

要實現更一般化的人工智能需要跨越的巨大鴻溝就是所謂的「語義鴻溝」。我們要如何將深度學習(低階語義)系統與邏輯(高階語義)系統的能力融合在一起?

人類思維能夠發揮邏輯推理的偉大功績。如果我們的思維機器都是基於直覺的,那麼它是如何做到這一點的呢?我要在這裡假設我們沒有任何天生的邏輯裝置。在我們已經存在於這個星球上的短時間內,現代智人不大可能發展出這種認知機制。因此,為了消除語義鴻溝,我們需要使用只基於直覺的機制來彌合。這意味著我們不需要將邏輯組件與直覺組件進行融合。我們所需要一切的就只是直覺組件。

因此我們需要充分的證據來證明,複雜的邏輯思想可以通過直覺機器來完成。

這才是 AlphaZero 革命性的啟示。AlphaZero 是 DeepMinds Go play 程序的最新版本。我之前介紹過 AlphaGoZero 如何可以從零開始掌握圍棋的玩法(不需要人類的經驗)。西方人從來沒有玩過圍棋的遊戲,根本就不理解它。所以 DeepMind 的 AlphaGoZero 成就的相關性已經被消除了。我們不明白這個成就的重要性。然而,圍棋一直被認為是一個直覺遊戲。所以一個基於直覺的機器掌握了這項遊戲並不令人驚訝。

什麼?DeepMind 的新化身(AlphaZero)卻能做的就是玩國際象棋?這對很多人來說仍沒有什麼令人驚訝的,自 1996 年 IBM 的 DeepBlue 擊敗卡斯帕羅夫以來,這個遊戲就被「解決」了。對於外行來說,AlphaZero 只花了幾個小時就能從頭開始掌握國際象棋遊戲也沒什麼值得注意的。甚至 AlphaZero 在 100 場比賽中能夠摧毀最好的國際象棋程序 Stockfish 也並不值得注意。

真正了不起的是 AlphaZero 在消解更合乎邏輯的對手方面所起的作用。為了讓你理解,我會引用一些像棋社區的評價。

它接近「類型 B」,按照克勞德·香農和艾倫·圖靈的夢想,用類似於人類的方法來下棋,而不是蠻橫的力量。

—?Gary Kasparov。

我總是在想,如果有一個超級先進的物種降落在地球上並向我們展示他們如何下棋,那將是怎樣的情況。現在我覺得我知道了。

—?Peter Heine Nielsen

它的棋路不像人類,但也不像程序。它以第三種方式,可以說是外星人的方式下棋。

?—?Demis Hassabis(DeepMind 創始人,國際象棋愛好者)

對於那些瞭解國際象棋的玩家來說,最好的辦法就是觀看 AlphaZero 和 Stockfish 的實戰。你會看到的是一個基於直覺的系統如何拆解基於邏輯的對手。以下是遊戲及專家評論:

AlphaZero 國際象棋的走法非常不同。為了獲得優勢超過對手的位置,它願意犧牲一些棋子。它正在發揮一種國際象棋柔道,利用對手的對短期利益的熱切渴望來對抗它。它將對手置於國際象棋中稱為「被迫強制」的地位,無論如何走動都只會導致更糟糕的結果。

國際象棋的遊戲似乎更具整體性,所有棋子都以高度協調的方式移動。AlphaGo zero 所進行的遊戲最大限度地發揮了它的創造力,而它的邏輯對手無法超脫短期收益。它不僅在用一種不可想像的方式來玩國際象棋,而且這種方式將被置於令所有人驚歎的位置上。

關於 AlphaZero 的論文在最近結束的 NIPS 2017 大會上發表。那是一篇很短的論文,主體部分只有 7 頁長。它提供了廣泛的關於如何評估棋盤上的落子位置和決定下一步走法的有趣的細節。

和 Stockfish 每秒搜索 7 千萬位置相比,AlphaZero 每秒只搜索 8 萬個位置。

直覺機器使用的評估比邏輯對手少 1,000 倍。

你在這裡與 AlphaZero 共同見證的是對我關於直覺機器和他們執行邏輯推理的能力的原始論證的驗證。這是被鏈接的語義鴻溝。這是一個極其艱巨的通用人工智能的里程碑正在以創紀錄的速度被超越。我想 AI 界的任何人都期望這樣的進展能夠迅速地實現。現在這樣的事情已經發生了,人工智能的風景將被永遠改變。


12/18 21:55
生成PDF文件 列印


回復: 「全能棋王」AlphaZero的啟示 直覺如何戰勝邏輯
#2
管理員
Benutzerinformationen


新AI Alphazero 看來已進化到
不但內力深厚 又具 高深武學造詣
快化身成 太極張三豐了


引文:
它的棋路不像人類,但也不像程序。它以第三種方式,可以說是外星人的方式下棋。

對於那些瞭解國際象棋的玩家來說,最好的辦法就是觀看 AlphaZero 和 Stockfish 的實戰。你會看到的是一個基於直覺的系統如何拆解基於邏輯的對手。

AlphaZero 國際象棋的走法非常不同。為了獲得優勢超過對手的位置,它願意犧牲一些棋子。它正在發揮一種國際象棋柔道,利用對手的對短期利益的熱切渴望來對抗它。

12/18 22:03
生成PDF文件 列印







可以查看文章。
不可發文。
不可回復。
不可編輯自己的文章。
不可刪除自己的文章。
不可發起投票調查。
不可在投票調查中投票。
不可上傳附件。
不可不經審核直接發文。
不可使用主題類別。
不可使用HTML語法。
不可使用簽名檔。

[高級搜索]


Powered by XOOPS © 2001-2015 The XOOPS Project