2016年3月15日 星期二

人類與人工智慧的最後一戰

  AlphaGo VS 李世石的一戰,最終在4:1的比分下結束了比賽。李世石勉強守住了一局。雖然第五局,李世石的優勢延長了許多。同時玩出了局部「重複局面」,估計使用蒙地卡羅算法的AlphaGo面對這個對九段棋手稀鬆平常的局面(據Michael Redmond),深度超過了它的當前的搜索深度(在它目前的硬件條件下)。這無疑可以當成日後人類棋手再次(如果還有的話,可能性即使有,大概也是明年底以後的事情了吧!主因還得看是否有意義!)迎戰AlphaGo的「思想武器」。用局部的「深度重複局面」組合成一個完整的戰略,各個擊破AlphaGo。AlphaGo 的優勢也很清楚的表現在這幾盤,那最終落子可能性越來越少時,它的耗時也非常少,而這一點對人類非常不利。今天李世石下出了280手,AlphaGo居然也跟著玩下去,並最終取勝,就是一個很客觀的證據(即便理所當然)。
160315_0a9rhs
(取自:Board19 | 圍棋 News)
  這一次AlphaGo除了在右下角陷入劣勢之外,也下出了許多「蒙地卡羅演算法」的棋步。

今天的另一個話題是AlphaGo 取得了韓國棋院頒發的九段證書,又製造了一個第一,那就是AlphaGo 成為第一個非人類的九段「棋手」。
(取自韓國棋院推特)
這一戰雖然結束了,卻也引爆了很多話題。包括為什麼要挑李世石據說已經過了巔峰期的九段高手,而不挑年輕正盛才十八歲的2015職業棋手冠軍柯潔九段。其實之所以會有這個問題出現,完全是因為比賽出現了所有九段棋手都始料未及的局面,也即AlphaGo太強大了。因此,在第一局李世石落敗後這個無謂議題便被提出。如果李世石輕鬆完敗AlphaGo,這個問題被提出的機率就太小了!但挑柯潔,有代表性嗎?顯然不夠代表性。一個2015年才站上冠軍寶座,拿下三座世界賽冠軍獎杯,2016年年初積分冠軍的棋手,很難跟一個已經在棋壇上拿到十八個世界賽冠軍獎杯(亞軍就不計了),「近十年職業圍棋世界排名第一時間最久的棋王」、早年擁有「飛禽鳥不敗少年」之稱的李世石的地位、傳奇性、穩定性等相提並論。如果柯潔今年無法守住世界冠軍寶座,那麼他的狂言就更像是一個笑話。不說Google可能不會再舉辦這樣的比賽,即使舉辦了,如果要依照現在「捧」柯潔出來應戰的說法,也是挑「當年的(或前一年的)冠軍」。柯潔能「繼續」取得該年的(或該年前一年)冠軍嗎?如果不能,那絕對是一個笑話無疑了!柯潔雖然自稱自己在與李世石的十次戰役中「輾壓」了李世石,但這麼重大的世紀戰役,不挑像李世石這樣的「傳奇」,卻挑這個本想「終結傳奇」最終卻因為比分太近而改稱「向傳奇致敬」的年輕棋手,會發生什麼事?一由於柯潔是中國人,Google是美國企業,如果最終比分比這次的還遭,柯潔被5:0完敗,那麼估計類似以下並不陌生的說法便會出現:「為什麼要挑一個才剛十八歲的柯潔?而不挑一個有更豐富的實戰經驗的棋手(譬如石佛、李世石、圍棋皇帝)?」「這一切都是美帝的陰謀。」「這根本是在用圍棋對中國進行羞辱。」「根本是在摧殘幼苗。」諸如此類比這還難聽、更陰謀論的言論會被「引爆」,似乎也不難「推估」與「想像」。而所有這一切也可能因為應戰的是一個還尚未自己創造傳奇的棋手是一個中國人,於是在台灣的「輿論導向」下,被引導到另一個方向。任何因為柯潔被完敗而引來的笑話、嘲諷,只會更多,不會更少,而觀眾可能也會因此大減(至少就台灣而論)。
  從媒體一開始報導「李世石」的「世界棋王」頭銜,至今逐漸的變成了「南韓棋王(從全球變成區域)」、「圍棋天才(與冠軍無關)」,以致於到了一些仇韓的台灣人口中,又從圍棋界正常的「李九段」變成了「韓國狗」!從多數人期待李世石代表「人類」棋手扳回一城,到李世石真的扳回一城時,仇韓的台灣人便開始宣傳「放水、作弊」等等荒謬言論。少部分媒體顯然正刻意在引導著觀眾,至於目的是什麼,就不多說了!台灣民眾本來就容易被媒體操控,沒想到在這麼一個意義如此重大的世紀大戰中,仇恨的叫囂聲仍然不絕於耳!
  至於接下來Google還會再辦比賽嗎?我想很多人可能跟我一樣不太在意了!就跟當年更深的藍打敗卡司帕洛夫後的情景一樣,這也是人心的基本規律!
  柯潔用「輾壓」來形容他對李世石的戰役,但根據統計學,這樣的樣本數實在太少,代表性不足。如果一個棋手「輾壓」的不是「傳奇」,那麼他也不會成為「傳奇」,可是如果自己的傳奇必須用這種方式來創造,那也是很可悲的事情!柯潔能在十八歲拿到職業棋手的世界冠軍,當然有實力作為依據。可當今有太多人是連柯潔的實力都沒有,卻敢於藉由背後龐大的勢力,以為可以藉由背後龐大的勢力來「輾壓」「傳奇」,以成就自己的「傳奇」。同時在龐大勢力的支持下,掩蓋龐大勢力在背後支持的「真相」!從這點來看,人不輕狂枉少年的柯潔,可能還顯得可愛一點!
  李世石與AlphaGo的一戰,讓我覺得更像是一個「普通人類高手」對抗「超人類」或者簡稱「超人」的情況。只是這個「超人」是由龐大的硬件所支撐,而在現實的世界上,許多不是因為自己的實力而是被媒體「捧」出來的人,支撐他虛假面具的卻是其背後的龐大勢力。真正「輾壓」「傳奇」的是他背後的勢力而不是他個人,但他背後的勢力只要足夠強大,完全可以掩蓋所有的真相!而世人將只是或者依然是被愚弄與玩弄的玩物!
  這種「超人」與「人類」的對比,也讓我想起了十幾年前與「淺紅」這套象棋軟體的幾場「大戰」。由於當時一個人正在台北,為了從象棋對奕過程中提取「策略」,也為了建構抽象的「通用策略框架」,因此常常跟這套不算強的棋軟玩上幾盤。讓我映像深刻的是,為了理解一個類似「超人」對「人類」這樣的「智力差距」可能達到什麼「後果」,於是我跟淺紅的不同人工智慧等級進行了對奕。其中,在接近初級的情況下,我可以下出「全軍」而勝的局面,也就是一顆棋子都沒有損失,就吃掉了對方所有的棋子(不只是取勝,而是吃掉對方所有的棋子。可惜棋譜沒有保存好。);或者用大概五步到七步的走法取勝而結束棋局。這讓我深刻理解到,當一個人理解了對方的「行為模式」、「判斷準則」之後,他便可以把對方完全的操弄在手中!可惜,由於生活的不穩定與資源的匱乏,我一直未能完成這個「通用策略」演算法,以及設計出一個「通用的」「策略導向」的棋類軟體!
  從李世石這五局一路看下來,讓我比較印象深刻的除了實際的對戰局面以外,還有Michael Redmond九段在李世石還在思考階段時的一些推測、分析。從中我們不難發現,人類棋手可以瞬間掌握一些關鍵的步數,這是屬於所謂「策略導向」,這通常是局部性的思考,直到棋盤到了中盤時,才會更接近於全局性思考(在國際象棋、中國象棋上一開始就是全局思考,這是因為相對而言棋子的擺設都已經固定,而且棋子被吃以後也不能再回到棋盤上。)。而「勝率導向」,一般是由評價函數對整個盤面進行計算來進行的,也即電腦圍棋、象棋的主要設計方式。雖然,人類也會評價局面,但人類並不會實際上去計算這個子價值多少,而是類似這個子重不重要,是否損失後就會影響勝敗等判斷。因此,電腦是根據一個可能不夠客觀的「精確數值」來計算並最後經由比對數值大小而做出判斷,而人類主要是用更「模糊」的方式來直接做出判斷。因此,不妨思考,如果把「策略導向」的技術結合「勝率導向」技術會如何?因為策略導向本身可以以人類的方式進行思考,而勝率導向可以從這些思考方向進行深度計算,如此一來這樣的計算可以在同樣的時間下往更深的層次進行計算。果真這樣的軟體被設計出來了,相信圍棋即便只用單顆CPU都能完敗九段棋手。這才叫「輾壓」!
  在個人的思考裡,這樣的技術可能最終被用在全自動化的軍事設備上,譬如無人機戰鬥群、機器人小組、坦克群、直升機戰鬥群等,因為如果人類還想要用遠端遙控的方式來操縱無人機群進行戰鬥,那無疑就像是古代的千里御將一樣,或者用電腦架構來比擬,是類似因為RAM太小而不停的從硬碟提取資料一樣。顯然,這最後可能會造成災難,或者必然造成災難。而當人工智慧已經可以操控整個無人機戰鬥群,進行即時演算,與協力作戰時,我相信沒有一個國家還能取得任何的空中優勢!即便他們可能擁有性能「更」優的機種。
  這樣的技術,哪一個大國的國防部會不感興趣?唯一可以慶幸的是,個人已經暫時終止了這些研究計畫。如果當年我接受了營長的建議,向陸總部就加密技術進行提案,或許今天個人的人生會走向不一樣的景況。不過歷史無法假設!這種全自動化的技術,顯然便是未來的技術。人工智慧最終必然用到軍事領域,這是絕對無法避免的事情!也是一個最終會降臨的現實,就好像人類終將敗在電腦圍棋手下一樣。只是,這一次未來會用多快的速度前來呢?這一點就留給未來自己來揭露了!
  至於人工智慧接下來的發展重點,自然是「自然語言理解」!這才是終極的「聖杯」!


4 則留言:

  1. http://www.cna.com.tw/news/firstnews/201603150491-1.aspx 李世石表示:「AlphaGo不是高手,是人類可以應對的水準,所以最終的結果令我遺憾。」

    回覆刪除
  2. http://www.cna.com.tw/news/firstnews/201603150508-1.aspx 李世石表示,他非常享受與AlphaGo的對戰,經過這次比賽,他對於傳統圍棋步數典範有了「新的理解」。
    朔雪寒註:這正是我期待的事情。

    回覆刪除
  3. http://www.goratings.org/ 目前柯潔第一,AlphaGo因有一敗才能進入排行,成為第二,因此如果世界上有哪個從來不敗的,是無法進入這個排行的。

    回覆刪除
  4. http://geek.csdn.net/news/detail/61218 比較淺顯易懂的技術詳解。

    回覆刪除