跳到主要內容

科技大觀園商標

分類項目
Menu

AI來了,挑戰也來了!

108/03/26 瀏覽次數 5852

21世紀以來,數位科技以過去無法想像的速度演變。從雲端計算、大數據、資料科學,到現今的人工智慧以及區塊鏈,已有形無形地對我們的生活產生巨大的影響。發展至今,企業得以透過巨量資料的累積精準分析使用者的行為。在資料驅動的時代,沉寂已久的人工智慧技術的子領域「機器學習」技術開始發光。

 

會「特徵工程」的深度學習

 

機器學習是從資料中學習而建立預測模型的一種技術,科學家在建立這些模型的過程中,必須根據以往的經驗或領域的相關知識,篩選建構模型所需的訓練資料,這個篩選訓練資料的過程稱為「特徵工程」。

 

過去,機器學習在處理非結構資料上十分困難,而且特徵工程仰賴科學家個人的經驗。例如,在影像辨識中,一般能確認的特徵是圖片中一個像素的RGB數值,很難對一張圖片做有意義的特徵工程。在語音辨識中,特徵是一段波形的數值,我們也很難從一個波形中分析對應到的特徵。但近年來有一項機器學習的技術卻能夠很好地處理非結構的資料,那便是「深度學習」。

 

深度學習與一般機器學習不同處在於擁有自我篩選以及轉化資料特徵的能力,稱為「表徵學習」。在深度學習中,每一層的神經網絡與每層網絡中的每一個神經元都在進行資料轉換,這些轉換可以視為深度學習本身在做特徵工程。因此,擁有表徵學習能力的深度學習,就可以應用在電腦視覺以及語言處理等人類不擅長做的特徵工程領域。

 

2012年的電腦視覺辨識競賽中,由加拿大多倫多大學團隊提出的神經網絡AlexNet獲得了空前的準確率,並率先利用圖形處理器加速神經網絡的訓練,解決以往訓練緩慢的問題。

 

與機器互動的未來

 

在電腦視覺方面,利用深度學習做物體辨識與物件的分割,這樣的技術可用於人臉辨識協助建立資訊安全系統,未來也可以協助辨識通緝犯。在醫療上,這樣的技術可以用來建立醫療輔助系統,協助醫生辨認癌細胞。這些是人工智慧在電腦視覺方面較簡易的應用,更複雜的則如自動駕駛車以及無人機操作等。

 
目標檢測與識別應用是人工智慧的簡易應用。目標檢測與識別應用是人工智慧的簡易應用。
 
在ILSVRC2015國際競賽上,首次出現準確度超越人類的模型——ResNet。當人工智慧的效能超越人類的時候,就足以把這樣的技術應用在實際生活中,把人工智慧作為一項工具來輔助人類。
 

語言的使用以及人與人之間溝通的能力,是人類擁有智慧的象徵。近年來,深度學習在語音辨識以及文本的處理上也獲得了空前的成果。其中,聊天機器人是最受矚目的,通常是處理單一化任務如訂餐、金融服務等。聊天機器人除了能夠提供合適的服務外,還應具備溫度。如微軟小冰是一位16歲的女孩,善於陪伴,對話流暢,回答逗趣,也會寫詩,並出版了《陽光失了玻璃窗》詩集。

 

另一個語言文本方面的應用是行動助理。行動助理未來的目標是包辦使用者的大小事,必須具備處理多功能的能力。2018年的Google I∕O大會,Google發表了Google Assistant,展示如何替使用者預約剪髮。Google Assistant不僅具備流暢的對話能力,更令人印象深刻的是其擬真的語調。儘管使用的是英文,但可預期技術會在地化。未來口語將會成為我們與電腦互動的方式。

 

人工智慧新進展:生成模型與增強學習

 

除了深度學習外,近年來有些技術在與深度學習結合後也漸漸綻放光芒,如:「生成模型」與「增強學習」。

 

生成模型是藉由生成對抗網絡同時訓練兩個對抗的神經網絡來從事創作,如二次元動漫人物的生成以及圖片的風格轉移。在風格轉移上,可以把一張照片轉換成不同的畫風,也可以用在影片上,對影片做即時的風格轉換。也有科學家用在生成藝術作品上,生成對抗網絡根據輸入的風格樣本產生出另外一種風格的設計。另外,也可把這樣的生成技術用來編寫樂曲。

 
生成模型藉由生成對抗網絡,同時訓練兩個對抗的神經網絡來從事創作,結合深度學習技術,漸漸有耀眼成果。圖為圖片風格轉移的示意圖。(圖/Gatys, L. A., Ecker, A. S., & Bethge, M. (2016) Image style transfer using convolutional neural networks, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 2414– 2423)生成模型藉由生成對抗網絡,同時訓練兩個對抗的神經網絡來從事創作,結合深度學習技術,漸漸有耀眼成果。圖為圖片風格轉移的示意圖。(圖/Gatys, L. A., Ecker, A. S., & Bethge, M. (2016) Image style transfer using convolutional neural networks, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 2414– 2423)
 
增強學習是一種由回饋機制引導學習的方式,是源自控制理論與動物的學習方式。在增強學習中,代理人經由觀察周遭的環境而做出決策與環境進行互動,如果今天代理人做的決策與我們想達成的目標相近,就給予獎勵;如果與我們的目標相斥,便給予懲罰。代理人藉由不斷與環境互動,逐步修正自己的行為,這樣的學習方式貼近人類的試誤學習。2013年,英國DeepMind團隊結合深度學習與增強學習,讓人工智慧學習怎麼玩電視遊樂器,打開了深度增強學習的研究大門。
 

為什麼研究增強學習有很高的技術價值?主要是因為增強學習技術可以有效處理單一目標但策略可能很複雜的事情。此外,增強學習是經由探索決策空間(決策的所有可能性),來學習怎麼處理決策問題。因此,如果利用增強學習技術探索複雜的決策問題,將能超過人類的水準,進而幫助人類。

 
AlphaGo Zero顛覆圍棋認知
 

最知名的例子就是2016年DeepMind開發的AlphaGo。AlphaGo先學習了人類的知識,再利用增強學習不斷與自己對弈來成長,最後在與頂尖職業棋士李世乭的交手中勝出。隔年,DeepMind發表了新版的AlphaGo Zero,Zero代表不經由人類知識學習,AlphaGo Zero藉由不斷與自己對弈來成長,學習的速度卻更加快速,最後成了最強的圍棋程式。在學習過程中,AlphaGo Zero發展了自己的定式,與人類有所不同。這樣的定式是AlphaGo Zero認為最佳的選擇,顛覆了人類以往對圍棋的認知。

 

在人工智慧的發展中,AlphaGo Zero確實在圍棋上獲得絕佳的成果,DeepMind也做出歷史性的突破。這樣的突破是建立在完美資訊賽局、離散控制、離散時間回合制且可預測行為下的競賽。

 

完美資訊賽局指的是我們可以知道全盤的資訊,但在現實生活中我們觀察到的資訊是片面的。離散控制指的是圍棋的決策是 19×19種可能性,並非一個連續的數值(角度、電壓大小),且隨著棋局的進行,其決策空間(可落子的選擇)會越來越小。

 

離散時間回合制是指在這樣的情境中,我下一手,你下一手,彼此輪流的,而非可以任意選擇決策的時間點與次數。可預期的行為則是下完一子之後的盤面是清楚的,我們落了一子就一定會對應到特定的盤面結果,而非具有隨機性的結果。

 

目前,DeepMind著重以即時戰略遊戲星海爭霸二(StarCraft II)作為增強學習技術的研究平台。預期這項挑戰的突破,能讓增強學習技術進入全新的階段。 

 

社會倫理的挑戰

 

人工智慧將不斷地發展與突破,逐步實現更強大的應用。但在發展的同時,相應的問題也會一一浮現。

 

人類發展科技無非是希望能讓生活變得更好,技術本身沒有對錯,但在使用這些技術的同時,我們也必須保有崇高的道德。因為我們都期望一項技術是能夠造就全人類甚至全地球的利益,而不是帶來毀滅。當人類不具備崇高的道德時,我們本身便是發展科技的絆腳石。

 

隨著人工智慧科技的發展趨於成熟,在實際運用上也會出現權責歸屬問題。如同以往使用其他科技產品一樣,若過度依賴人工智慧技術,會不會讓我們的思考落入單一化?近年來,影像辨識技術成熟,把它用在醫療診斷中,醫生可以藉由人工智慧協助診斷病情,但若不幸做出錯誤的診斷時,誰將負起責任?又如自動駕駛車,當人類把車輛的操作權全部釋出時,若車輛肇事了,要怎麼評斷是非?

 
科技的進步已有形無形地對我們的生活產生改變,也影響產業生態。(圖/種子發)科技的進步已有形無形地對我們的生活產生改變,也影響產業生態。(圖/種子發)
 
對大多數人來說,最大的擔憂應該是人工智慧技術帶來的產業變革。技術的成熟將帶來大規模的應用,也會造成社會適應問題。
 

從工業革命到電腦的出現,工具的進步都大大改變我們的生活型態與產業生態,也因而有許多人的生計受到影響。另外,有一些產業與文化傳承相關,這類產業具有傳統技術與工匠精神,但在自動化生產的情況下,人們傾向選擇便宜可用的物品,導致這些保有人文精神的產業沒落。甚且,即便現今已進入電腦時代很久,仍然有許多人不會使用電腦。未來人工智慧時代,怎麼協助受影響的人們適應新時代是重要的議題。

 

另一個重要的議題是,如何確保人工智慧相關知識的推廣,在帶動產業前進的同時,不會有其他社會問題出現?回想諾貝爾獎的創立人諾貝爾先生是炸藥改良的重要推手,但他的發明也被濫用在戰爭中,造成龐大的傷亡。科技是中立的,而使用科技的人為善為惡,將決定這個技術是為人類社會帶來進步還是破壞。人工智慧技術的推廣跟普及的過程,可能面臨的人性兩面差異帶來的社會變化,是我們要及早因應的。

 

資料霸權:資料取得的不平等 

 
以目前多數的人工智慧應用來說,都需要大量的使用者資料來建模。這一點對於年輕世代踏進相關技術的開發上,也會面臨難以突破的「資料霸權」障礙。人工智慧模型的執行成效高度依賴大量資料的餵養,但目前全球與使用者有關的數位資料多數由軟體雲端巨人公司掌握。
 
人工智慧模型的執行成效高度依賴大量資料的餵養,但目前全球與使用者有關的數位資料多數由軟體雲端巨人公司掌握。<人工智慧模型的執行成效高度依賴大量資料的餵養,但目前全球與使用者有關的數位資料多數由軟體雲端巨人公司掌握。

因此,扣除如製造業中提升良率等應用,多數企業要跨到異質資料整合,要有使用者分析等資料應用,都十分難以實現,因為這些企業取得使用者資料的成本非常高。這種資料霸權存在於提供線上服務的巨人公司。

 

現在的數位世界是高度的不對稱,軟體巨人們擁有資料霸權就獨占數位經濟活動的主要話語權。過去WWW的發展,造就了這二十幾年來數位經濟的快速成長。WWW帶來的特點就是公開、平等存取,網路之前,人人平等,造就幾波.com爆炸性的產業創新革命。

 

年輕世代大量從Internet得到跨越前人所設立的產業屏障機會,很多過去的巨人都在這一波中下架,這是一次知識經濟革命的具體展現。然而隨之發展了二十多年,可以發現,屏障儼然再度出現。這個屏障不是人工智慧的技術不對等,而是資料取得的不對等。

 

目前歐洲的歐盟資料保護規範正掀起一場對資料擁有權的重視,這會不會有機會帶來資料取得權利的變革,是值得關注的。要突破資料霸權屏障,跟過去WWW帶來的知識經濟革命一樣,企業必須再次創造新的「資料經濟」革命。如此,才能由更多的年輕企業創造出更多跨領域以及全新的人工智慧服務。

 
資料來源
  • 《科學發展》2019年3月,555期,6~13頁
  • 原標題:人工智慧的非技術挑戰
OPEN
回頂部