2016年3月17日 星期四

策略的哲學序

  朔雪寒註:2016年,Google DeepMind 研發的AlphaGo 已成功擊敗人九段高手,擊破了圍棋那道由「巨大」「可能性」所構築成的堡壘,那道原本必須倚賴人類的「智能、智慧」才能擊破的堡壘。這件值得紀念的「壯舉」是在科技巨擘Google相關硬體技術的支撐,以及軟體技術如蒙地卡羅演算法的支持下所完成的,Google也順利拿到人工智慧倒數第二個「聖杯」。這十年來,個人對於策略的思考並未中斷,對於策略資料的收集也並未中斷,中斷的是對這本書的補充以及對相關電腦技術的研發。當初假設自己有兩年的時間,能利用工作閒暇把這個「通用策略引擎」設計妥當。卻因為人生面臨了更多的事情,加上念研究所等事而擱置,最終差點被我遺忘。當年的這個假設受限於環境而無法「執行」,結果不到十年的時間,Google卻已用其他方式擊敗了圍棋界的頂尖高手。如果從預測的角度而言,估計這個世界很難找到有人比我預測圍棋會在十年內被「人工智慧」擊敗更早的預測了。(若有請告知,將補充。多謝。)雖然最終沒能在自己手上終結這場戰役,以及拿到「聖杯」,卻也樂於見到大企業如Google用了其他方式達到了這個目的。

   這十年來,我大概也終止了跟棋軟下棋的做法,主因也是因為多數的工作已經接近完成,剩下的只是「實作(執行)」。因此,雖然Google已經拿到了「聖杯」,且目前的局勢可能、有機會讓AlphaGo「不小心」成為2016年世界圍棋職業棋手的冠軍(果真如此Google或臉書再戰人類都將沒有任何巨大意義。),但這並不會打消我完成原本計畫的念頭。目前的想法大概就是從以前所沒有完成的部份接下去,至於什麼時候完工,個人並不清楚,因為還是得考量「險惡」的環境加諸於個人身上的迫害與影響的程度。

   不管是硬體、思想,外在世界的或自我探索的,這十年來都有了不少進展。個人對於古代策略、當代博奕論以及棋軟演算法、統計與概率、預測,都有了一些新的想法。我相信最終的成品,將會更令人滿意!

2016.03.17

  一九九三年,數學家利用電腦進行窮舉式計算證明:「五子棋」先手必勝;一九九七年,深藍以三和二勝一敗的成績打敗「國際象棋」棋王卡斯帕洛夫……二零零六年,由第十屆電腦「中國象棋」奧林匹亞大賽冠軍、季軍分別向特級大師于幼華、卜風波挑戰,都先手和局。國際象棋與中國象棋的複雜度相當,而後者稍多些,每個盤面大概有四十幾種變化,「日本將棋」的變化是中國象棋的三倍左右,「圍棋」的變化又是日本將棋的三倍左右,高達三百六十一種變化。依據摩爾定律,晶片上電晶體的數量每十八個月增加一倍,速度獲得相應提昇;從一九九七年至今已經過了快十年,個人電腦運算速度從233 MHz飆升到2.13 GHz,CPU也已經由單核心往多核心的運作方式前進,但植基於個人電腦的棋軟,如中國象棋軟件卻仍然無法打敗特級大師,棋力約在八段以上,日本將棋的棋力只到三段,圍棋的棋力更是令人難以忍受,只有八級左右。
  為什麼有些甚至已有千年以上歷史的棋類,人類能勝任如此愉快,而運算能力超越人類成萬上億倍的電腦卻遲遲無法打敗人類呢?因為目前的電腦象棋其實並不是在運用智慧下棋,而是在進行暴力搜索或者選擇性搜索出棋步,因此當變化增多時其所能計算出的步數也就相對減少。在這種情況下,電腦象棋極端依賴於硬體速度。而電腦每增加一倍速度,電腦象棋的搜索深度不過增多一層左右罷了。這在面對如圍棋這般千變萬化的遊戲時,便顯得捉襟見肘,難以為繼;即使深藍以自身的超強運算能力對抗棋王,也還是要一敗三和,不能全勝棋王。那麼為何沒有人將智慧賦予電腦,讓電腦採用「搜索」以外的方法下棋呢?因為「搜索是電腦的長處」、「模擬人類思考的方法設計起來極為困難」、「強AI的設計難有突破」!於是,人們開始從一加到一百,想要獲得那個解答,卻渾然忘了還有一個公式可以讓人們用更快速的方式得到答案。當習慣一旦養成,想要改弦易轍便難如登天,而這樣的習慣至今不過五十幾年。
  二零零三年,筆者將近十年來研究兵法的成果加以整理總結,並嘗試將三千年來中國兵法中屬於對外用兵的相關智慧統一在一個理論框架之下,於是有了《策略的哲學》。《策略的哲學》既是策略的集成,也是中國先哲們(主要指先秦至唐)處事智慧的集成之作,內文共分為三大部分,分別是:〈分析篇〉三章,〈理論篇〉三章,〈兵法篇〉之「國、地、城、軍」四卷。〈分析篇〉主要分析兵法、策略、競爭及思維之基本概念與規則,〈理論篇〉主要在探討制定策略的框架、模型及方法,而〈兵法篇〉之「國、地、城、軍」四卷則依據一定的規則與架構收錄古代兵家所制定出的種種策略。〈兵法篇〉之「國、地、城、軍」四卷的內容主要來自於先秦至唐的兵家及思想家們的相關論述,並依照簡單的架構加以鋪陳以便於使用者索引及記憶。
  這些提供智慧的先賢們自然主要以兵家為主,計有:呂尚(姜太公)、管仲、司馬穰苴、孫武(孫子)、吳起(吳子)、墨翟(墨子,又屬墨家)、孫臏、尉繚子、商鞅(商君,又屬法家)、黃石公、諸葛亮、李靖、李世民、陳規、揭暄等人。至於〈分析篇〉及〈理論篇〉的思維根源,也大多來自兵家的著述,也即所謂的兵書、兵法之中;但嚴格說來,是受到整個先秦時期諸子百家的綜合影響。本書的內容不僅幾乎包含兵家全部流派的論述,更包含先秦諸子的相關論述,可說是共冶於一爐,而也唯有如此才能得見策略思維之全豹。譬如書中既有崇尚道德的司馬穰苴、崇尚智謀的孫武、崇尚器械的墨翟、崇尚法制的吳起、更有崇尚勇力的商鞅,各人從各個方面對相關的主題進行各自的表述,從而使我們得以從各個面向與側重點對同一個問題進行更寬廣的思考,同時在面對世界紛繁複雜、種類各異的難題時,也能因此更輕鬆自如、游刃有餘。
  唐太宗李世民曾經說過:「夫以銅為鏡,可以正衣冠;以古為鏡,可以知興替;以人為鏡,可以明得失。朕常保此三鏡,以防己過。今魏徵殂逝,遂亡一鏡矣!」(〈貞觀政要.任賢〉)其中李世民的「以古為鏡」指得就是藉鑒歷史,而歷史之可資藉鑒者大抵不出「為人、處事」兩端。至於本書所提供的,卻是一面「思維之鏡」。構築這面「思維之鏡」的不只是歷史經驗的思維,更主要的是經驗昇華後的理論之思維,而經驗的適用範圍與適用性是遠不如理論的。所以本書的目的正在於提供讀者一套用以指導競爭行為的思維法則,以減低在競爭行為中取勝的偶然性成分。
  二零零六年,筆者終於找到機會重新修訂這本書,而這樣的機會則來自於筆者打算著手將書中的理論設計成電腦程式,以讓世人有機會領略一下古代兵法與現代科技結合下的威力會是如何的龐大。筆者認為若將這些理論設計成奕棋程式,那麼人類無論如何也不會是對手的,即便想和局也難,遑論取勝了。由於《策略的哲學》只是筆者「兵學現代化三部曲」中的首部曲,同時它所牽涉到的內涵主要是「對外用兵的智慧」而不包含《管理的哲學》所要談論的「對內管理的智慧」,因此它非常適合被設計成電腦奕棋程式;因為棋子本身不會有心理、生理等等問題,它們完全服從於奕者的指揮。因此,即以本書的理論便已足夠完成一具極具智慧的「策略引擎」,這個引擎將支援諸如「國際象棋、中國象棋、日本將棋、圍棋」四大棋種,引擎並將使用嶄新的理論,在對奕的領域徹底擊敗人類。幾千年前,黃帝曾因為懂得兵法而戰勝了擁有先進兵器的蚩尤,讓暴力在智慧面前喪失了尊嚴;二零零八年,智慧運用是不是又終將戰勝暴力搜索,我想這個程式將會告訴我們一個很明確的答案:一個不用再從一加到一百的答案。
 
朔雪寒 2006.05.06 書於台北 

沒有留言:

張貼留言