跳到主要內容
:::
登入
註冊
網站導覽
展開搜尋
全站搜尋
熱門關鍵字:
半導體
精準醫療
太空
煙火
關閉搜尋
您的瀏覽器不支援此script語法,請點選
搜尋
使用搜尋功能。
分類
分類項目
關閉分類項目
地理
天文
化學
醫學
科技
社會科學
人類文明
地科
心理
物理
數學
環境
生物
生活科學
醫療
地球科學
Menu
關於我們
文章
熱門文章
最新文章
精選文章
科學專題
影音
TechTalk
科普影片
活動
學生專區
夥伴
認證
公務人員
網站導覽
English
首長信箱
常見問答
雙語詞彙
關於我們
文章
文章
熱門文章
最新文章
精選文章
科學專題
影音
影音
TechTalk
科普影片
活動
學生專區
夥伴
認證
認證
公務人員
:::
首頁
文章
最新文章
Pleace Login!
×
請先登入
facebook
twitter
plurk
line
中
列印
書籤
:::
從Erica到AlphaGo戰勝棋王之道
106/04/11
瀏覽次數
1657
林順喜
|
臺灣師範大學資訊工程學系教授
AlphaGo打敗人類棋王是一個令入驚嘆的時刻,它也代表了人工智慧一個歷史性的成就時刻。在此演講中,我將談一談從Erica奪奧金、到AlphaGo打敗棋王李世石的一些技術。
劫爭在圍棋裏佔據了十分重要的位置,然而早期的電腦圍棋程式大都不具備打劫的能力。在2001年我們(我和黃士傑)在臺灣師大就開始研究這個困難的問題,利用賽局理論,我們得出本劫最佳的打劫策略,使得電腦圍棋程式在處理本劫時,能在局部求得獲利最大或損失最小的下法。
在2011年,我們(黃士傑、Rémi Coulom和我)針對「蒙地卡羅樹搜尋」提出一些新的啟發式演算法,成功的將「模擬平衡化」(Simulation Balancing)應用到圍棋。另提出各種不同之時間控制的方法。所有的實驗都是執行在我們的圍棋程式 ERICA,而 ERICA 正是得益於這些啟發式演算法、各種改良方案與實驗結果,成功取得了2010年在日本舉辦的電腦奧林匹亞的19路圍棋金牌。許多技術如「蒙地卡羅樹搜尋」及「棋型權重訓練」仍被用於AlphaGo。精心整合並改進了「蒙地卡羅樹搜索」、「大數據」、「深度卷積神經網路」、「監督式學習」、「強化學習」、「分散式高性能計算」等技術,這些更進一步被成功地應用在Alphago的程式中以提升其棋力。
由於這些傑出的技術研發成果,在這10年中,我們在臺灣師大偶然地造出了一條道路,促進了AlphaGo的誕生,終於打敗了人類的棋王李世石。
週末Let's go!分享大師視野粉絲專頁
圍棋(4)
人工智慧(140)
資訊工程(2)
推薦文章
113/03/27
全球暖化增加極端降雨機率,三大對策避免釀災
黃宜稜
|
科技大觀園特約編輯
儲存書籤
113/06/28
照光就變身!臺灣團隊打造的雙模式電晶體,挑戰電腦效能瓶頸
林祉均
|
科技大觀園特約編輯
儲存書籤
113/06/19
永續的碳循環產業鏈,讓二氧化碳不再人人喊「減」
陳彥諺
|
科技大觀園特約編輯
儲存書籤
113/04/23
揭開宇宙膨脹的背後推手「暗能量」的神祕面貌——專訪國立臺灣大學天文物理研究所助理教授藍鼎文
曾繁安
|
科技大觀園特約編輯
儲存書籤
OPEN
關於我們
關於我們
文章
熱門文章
最新文章
精選文章
科學專題
影音
科普影片
TechTalk
活動
活動
學生專區
學生專區
回頂部