從Erica到AlphaGo戰勝棋王之道

 
2017/04/11 林順喜 | 臺灣師範大學資訊工程學系教授
 
活動(演講)時間: 2017/03/17
 
AlphaGo打敗人類棋王是一個令入驚嘆的時刻,它也代表了人工智慧一個歷史性的成就時刻。在此演講中,我將談一談從Erica奪奧金、到AlphaGo打敗棋王李世石的一些技術。

劫爭在圍棋裏佔據了十分重要的位置,然而早期的電腦圍棋程式大都不具備打劫的能力。在2001年我們(我和黃士傑)在臺灣師大就開始研究這個困難的問題,利用賽局理論,我們得出本劫最佳的打劫策略,使得電腦圍棋程式在處理本劫時,能在局部求得獲利最大或損失最小的下法。

在2011年,我們(黃士傑、Rémi Coulom和我)針對「蒙地卡羅樹搜尋」提出一些新的啟發式演算法,成功的將「模擬平衡化」(Simulation Balancing)應用到圍棋。另提出各種不同之時間控制的方法。所有的實驗都是執行在我們的圍棋程式 ERICA,而 ERICA 正是得益於這些啟發式演算法、各種改良方案與實驗結果,成功取得了2010年在日本舉辦的電腦奧林匹亞的19路圍棋金牌。許多技術如「蒙地卡羅樹搜尋」及「棋型權重訓練」仍被用於AlphaGo。精心整合並改進了「蒙地卡羅樹搜索」、「大數據」、「深度卷積神經網路」、「監督式學習」、「強化學習」、「分散式高性能計算」等技術,這些更進一步被成功地應用在Alphago的程式中以提升其棋力。

由於這些傑出的技術研發成果,在這10年中,我們在臺灣師大偶然地造出了一條道路,促進了AlphaGo的誕生,終於打敗了人類的棋王李世石。
 
● 週末Let's go!分享大師視野粉絲專頁:https://www.facebook.com/go.masterview/
 
瀏覽人次:137
 
 
 
熱門標籤