從Erica到AlphaGo戰勝棋王之道|

從Erica到AlphaGo戰勝棋王之道

106/04/11 2052

林順喜｜臺灣師範大學資訊工程學系教授

AlphaGo打敗人類棋王是一個令入驚嘆的時刻，它也代表了人工智慧一個歷史性的成就時刻。在此演講中，我將談一談從Erica奪奧金、到AlphaGo打敗棋王李世石的一些技術。

劫爭在圍棋裏佔據了十分重要的位置，然而早期的電腦圍棋程式大都不具備打劫的能力。在2001年我們(我和黃士傑)在臺灣師大就開始研究這個困難的問題，利用賽局理論，我們得出本劫最佳的打劫策略，使得電腦圍棋程式在處理本劫時，能在局部求得獲利最大或損失最小的下法。

在2011年，我們（黃士傑、Rémi Coulom和我）針對「蒙地卡羅樹搜尋」提出一些新的啟發式演算法，成功的將「模擬平衡化」（Simulation Balancing）應用到圍棋。另提出各種不同之時間控制的方法。所有的實驗都是執行在我們的圍棋程式 ERICA，而 ERICA 正是得益於這些啟發式演算法、各種改良方案與實驗結果，成功取得了2010年在日本舉辦的電腦奧林匹亞的19路圍棋金牌。許多技術如「蒙地卡羅樹搜尋」及「棋型權重訓練」仍被用於AlphaGo。精心整合並改進了「蒙地卡羅樹搜索」、「大數據」、「深度卷積神經網路」、「監督式學習」、「強化學習」、「分散式高性能計算」等技術，這些更進一步被成功地應用在Alphago的程式中以提升其棋力。

由於這些傑出的技術研發成果，在這10年中，我們在臺灣師大偶然地造出了一條道路，促進了AlphaGo的誕生，終於打敗了人類的棋王李世石。

週末Let's go!分享大師視野粉絲專頁

圍棋(4) 人工智慧(166) 資訊工程(3)

從Erica到AlphaGo戰勝棋王之道

推薦文章