跳到主要內容

科技大觀園商標

分類項目
Menu

卷積神經網路

107/10/10 瀏覽次數 6752

前言

 
類神經網路(Artificial Neural Network,即為ANN或Neural Network, NN)是一種模仿生物神經網路(動物的中樞神經系統,特別是大腦)的結構和功能的數學模型或計算模型,由於在電腦科學上發展逐漸成熟,進而促使人工智慧新時代的來臨。實際上基本類神經網路的想法早在1940年代便已被提出,並在電腦科學發達的現今重新被重視;其主要方法是使用電腦程序大量模擬神經元傳遞訊號的行為,將所有的資訊輸入後反覆運算與修正;但呆板且大量的運算,即使使用現今最新的電腦科技所運用之硬體結構與運算方式,時間仍然耗費太多,於是在1960年代又有人提出了針對圖片或其他多維度資料型態(如:心電圖)的新神經網路,也就是本文主題卷積類神經網路(Convolutional Neural Network, CNN)。
 
 圖1:CNN用於圖片識別示意圖。(圖片來源:Youtube影音/網址:https://www.youtube.com/watch?v=FmpDIaiMIeA&feature=youtu.be&t=8m20s)圖1:CNN用於圖片識別示意圖。(圖片來源:Youtube影音/網址:https://www.youtube.com/watch?v=FmpDIaiMIeA&feature=youtu.be&t=8m20s)
 
結構:卷積層(Convolution)
 
卷積類神經網路的設計概念,就是針對資料特性判斷鄰近的資料;以圖1的二維資料型態為例,鄰近的資料就不像文字一樣只有前後方向,而是有上下左右的平面方向。明白這個特性後,就會瞭解到是要對圖片區塊進行分析,而不是將圖片分割成一個畫素一個畫素的作運算,即為以區塊為單位思考,找出圖片中期望的特徵,以圖2為例,即是找出叉或斜線區域,等號的右邊數值越接近1,表示該圖的該區域越像叉或斜線。
 
 圖2:用卷積層運算尋找斜線。(圖片來源:Youtube影音/網址:https://www.youtube.com/watch?v=FmpDIaiMIeA&feature=youtu.be&t=8m20s)圖2:用卷積層運算尋找斜線。(圖片來源:Youtube影音/網址:https://www.youtube.com/watch?v=FmpDIaiMIeA&feature=youtu.be&t=8m20s)
 
圖3:用卷積層運算尋找左右斜線與交叉特徵。(圖片來源:Youtube影音/網址:https://www.youtube.com/watch?v=FmpDIaiMIeA&feature=youtu.be&t=8m20s)圖3:用卷積層運算尋找左右斜線與交叉特徵。(圖片來源:Youtube影音/網址:https://www.youtube.com/watch?v=FmpDIaiMIeA&feature=youtu.be&t=8m20s)
 
結構:池化層(Pooling)
 
經過數學的運算後,數值高者表示與特徵越相像,換句話說,我們能得知什麼樣的特徵出現在圖片的什麼位置,以圖3為例,數值越高,即值越接近1,表示該區域與目標特徵越相像。雖然得到位置資訊後便可以直接進行下一步判斷,但實際上其實不需要那麼多的位置資訊,因此衍生出名為池化層的結構。池化層將數值分區化簡,亦即與特徵不相像的區域合併省略,同時精簡勾勒出目標特徵的大略位置(如圖4所示),藉此減少大量不必要的運算,搭配卷積層重覆執行,將圖片去蕪存菁,以圖5為例,原圖為81個畫素,減少成三張小圖12個畫素,才使用傳統類神經網路執行最終的判斷。
 
 圖4:用池化層簡化特徵的位置資料。(圖片來源:Youtube影音/網址:https://www.youtube.com/watch?v=FmpDIaiMIeA&feature=youtu.be&t=8m20s)圖4:用池化層簡化特徵的位置資料。(圖片來源:Youtube影音/網址:https://www.youtube.com/watch?v=FmpDIaiMIeA&feature=youtu.be&t=8m20s)
 
圖5:反覆進行卷基層與池化層運算得到最精簡的資料。(圖片來源:Youtube影音/網址:https://www.youtube.com/watch?v=FmpDIaiMIeA&feature=youtu.be&t=8m20s)圖5:反覆進行卷基層與池化層運算得到最精簡的資料。(圖片來源:Youtube影音/網址:https://www.youtube.com/watch?v=FmpDIaiMIeA&feature=youtu.be&t=8m20s)
 

結語

 

不同於傳統的類神經網路(ANN)採用的是暴力搜尋(Exhaustive Search),因此相當耗時,因為它必須要慢慢的找出所有資料的相互關聯性,同時作學習與判斷;而卷積神經網路(CNN)則加入了區塊的概念,鎖定有區域性質的資料型態,使其運算效能大大提升,不只圖片處理,所有二維的資料,包含2016年最火紅的阿法狗(AlphaGo)也使用相關的技術分析棋盤棋路。二維資料之外,只要有鄰近資料相關性,三維或多維度的資料也都可以使用。包含卷積類神經網路在內,新的類神經網路模型也不斷地被提出及改良,突破各種障礙不斷進步,讓人工智慧得以更加全面,推動的科技不斷向前,讓人類的生活品質更為獲得便利。

 

副總編輯:國立中山大學資訊工程學系 陳坤志教授

總編輯:國立中山大學資訊工程學系 黃英哲教授

(本文由科技部補助「新媒體科普傳播實作計畫」執行團隊撰稿)
OPEN
回頂部