資訊:電腦的心智思考
100/05/06
瀏覽次數
27995
洪宗貝|
高雄大學資訊工程學系
什麼是人工智慧
自古以來,人類基於好奇心,不斷地探索自我,不管是生理方面,從對各器官的了解到基因的分析;或是心理方面,從人類行為、情緒的觀察到心靈、智慧的思索。人們想更了解「我」是什麼,也想揭開「智慧」的祕密。不只如此,在科技發展日新月異的今日,人們更渴望讓機器、電腦也能擁有人類的行為與智慧。然而,智慧到底是什麼?這個問題在生物學、心理學、哲學等領域中都被廣泛地討論著。
一般來說,智慧是指對事情思考、分析、理解、學習、決策等的能力,簡而言之,就是解決問題的能力,因此人工智慧(artificial intelligence, AI)就是研究如何讓電腦有意識、能推理與行動。電腦的運作強項是計算與儲存,人則在感知、推理與行為方面略勝一籌,因此一般人工智慧的研究便專注在人類比電腦強的領域,例如下棋遊戲、語音或圖形辨識。
計算機科學之父杜林(Alan Turing)在 1950 年發表了在 AI 研究上極具歷史性的一篇文獻〈Computing Machinery and Intelligence〉,裡面提出一個方法來判斷怎樣的電腦才能稱為擁有人工智慧,這就是著名的「杜林測試」(Turing Test)。
測試方法是先把人和電腦安置在一個房間內,另外一個房間則安排一詢問者,使他與這未知的兩個受試者(人及電腦)進行一連串的對話。如果詢問者分辨不出回答者是人還是電腦,這部電腦就算是通過了測試,可證明它具有和人一樣的智慧,且能夠與人溝通。
人工智慧的發展
人工智慧的初始發展目標是讓電腦擁有人腦的智慧,讓電腦的行為更像人,而更遠大的夢想就是創造出一個栩栩如生的智慧型機器人,不但會思考,甚至有感情、情緒反應、學習等能力。但是直到目前,這依然是個夢想,科學家所面臨的瓶頸是人的智慧行為要如何完整地詮釋,而不只是填鴨式地建構。
大約在 1990 年代,科學家以現實的策略代替樂觀的想像,把人工智慧的研究目標轉向發展電腦的智慧能力,以更有效地解決一些複雜的問題,而不再強求要發展出像人類一樣的智慧。這使得人工智慧的研究漸漸走出低潮,新理論與新技術相繼提出,人工智慧的研究也更蓬勃地發展起來。
人類智慧相當複雜難解,想讓電腦模仿人的行為,實行起來並不容易,需要分成許多子領域去研究。一些較常見的研究領域,包括電腦視覺(看)、自然語言處理(讀)、語音辨識(聽)、機器人(動作)、專家系統(推理)、機器學習(學習),或是一些執行的方法,包含近似搜尋、模糊理論、類神經網路(artificial neural network)等。
而近年來興起智慧型代理人(intelligent agents)的概念,利用自動化、需求導向的電腦程式,整合不同的智慧能力,來代替原先人的工作,使得人工智慧的應用更深入人們的生活。
一般而言,要解決一個複雜的問題必須有特定的專業知識及強大的搜尋能力,而特定的專業知識需要有大量的儲存裝置及好的知識表達,強大的搜尋能力則需要非常快的計算速度。在硬體發展迅速的今日,電腦的計算與儲存能力只會愈來愈強,因此一些以前電腦做不到的事情,現在都可以輕易達成,一個有名的例子就是下面要介紹的人機大戰。
人機大戰
IBM 研發的深藍(Deep-Blue)在西元 1997 年擊敗了當時的世界西洋棋棋王卡斯帕洛夫(Garry Kasparov),讓全世界相當震驚,並質疑:「是否電腦的智慧已經超越人類?」這問題很耐人尋味。基本上,人類下棋的思維有以下幾個特點:揣摩對手接下來幾步棋會採取的策略;應用著名棋局中的模式;根據個人下棋的經驗;學習對手的下棋模式。
而電腦下棋時,則先把盤面局勢數值化,然後依據計算與儲存的優異特性與人類頂尖棋手抗衡。它「超強的計算能力」可用以計算接下來可能的局勢並搜尋最佳的下一步,而「龐大的儲存能力」可以儲存開局或殘局的所有棋局模式。此外,也可發展出「機器學習能力」,學習自己與對手的下棋模式,並修正錯誤決策。
今日電腦更可以憑藉著強大且平行或分散式處理的能力不斷增強棋力,挑戰各棋界的高手。目前各類棋奕中,似乎只剩下高複雜度的圍棋尚未被攻陷。
雖然電腦漸漸攻陷各種棋奕,但光會下棋,並不代表電腦擁有與人類相當的心智思考。下棋的條件與模式都是固定的,有既定的規則,因此能夠透過邏輯判斷與搜尋法則找到最佳、致勝的棋步。但是目前這些稱霸棋界的下棋程式,就只能處理棋局,當面臨其他條件多變的問題時,電腦還是無法如人類般聰明靈活。
冷血超人
在人工智慧的發展上,最成熟且應用最廣泛的是冷血超人,即專家系統(expert system)。所謂「專家系統」就是發展一個資訊系統,使它的行為表現可以和一位特定領域的專家一般,如醫療診斷專家系統或核能電廠故障診斷系統。它的基本原理是把專家的知識,以規則或其他知識表達方式建立在系統內,然後利用這些知識及經驗法則來推論並解決特定領域的問題,必要時還可給予使用者建議及解釋。
舉個簡單的例子,假設現在告訴系統幾個規則:
If 下雨天,Then 不要出去玩;
If 不出去玩,Then 要念書。
系統知道這些規則後,當輸入現在天氣是「下雨天」時,系統就會推論出「要念書」。在專家系統中,建立正確的知識庫是最重要的工作,給定不好的規則就會產生不好的結果,因此規則的宣告必須非常嚴謹,每一個規則之間的關聯都是牽一髮而動全身。
再舉一個例子來說明,假設規則如下:
If 你的另一半心情不好,Then 假裝不高興;
If 假裝不高興,Then 心情不好;
If 兩個人心情都不好,Then 會打架;
If 兩個人打架,Then 一個人會死翹翹。
現有一個事實說另一半心情不好,則根據所給的規則,系統是否應該推論出「一個人會死翹翹」?雖然每個規則單獨看起來都很合理,但是由人類的觀念來判斷,這個推論似乎不太正確。因此制定專家系統的規則要謹慎,只有當所給的規則正確時,才能讓系統產生我們所期待的正確答案。
從前面的兩個例子,可以了解專家系統最主要的部分是規則(知識)的取得,而知識的擷取與表達正是建立專家系統最大的困難點。知識的表達方式有很多種,最常見的就是規則表示法,規則多以「If……Then……」的形式呈現,以因果關係來描述知識,這也是認知心理學家所認為的人類內在知識表達方式。另外,專家系統知識的表達也包含了語意網(semantic net)、框架(frame)、邏輯等方式。
知識到底該用什麼方法來擷取與表達,目前沒有一個完美的答案,因此專家系統仍然有一些缺陷,但是專家系統還是有以下幾個優點:能蒐集許多有效、稀少的專業知識,並且可以成長擴充;不需休息,可以 24 小時執行監視等專業性的工作;能比人類專家更快速地做出反應;能在不良環境下工作;能理性地進行判斷,而不會受到個人價值觀的影響;能同時考慮許多因素來下判斷;能對其決策或行為做解釋。
由於專家系統具有這些優於人類專家的特性,因此這些年來,專家系統漸漸地實用化,廣泛應用在醫學、化學、經濟學、工程、運輸等領域,幫助人類做診斷、分析、預測、控制、行程安排等工作。
舉一反三
基本上知識的取得有 3 種方式:由知識工程師訪談得到、由專家利用知識擷取程式自行輸入知識,以及由機器學習的方式建立。
知識工程師的工作就是訪問專家,然後把專業知識轉移成電腦看得懂的形式。知識擷取工具則是直接從專家所提供的分類、屬性等特徵,產生規則或關係圖。至於機器學習,則是人工智慧的研究重點,期望能透過一些已知的例子,電腦就能自行推斷出相關知識。例如告訴電腦「燕子會飛、麻雀會飛」,具有學習能力的電腦就能歸納出「鳥會飛」。
機器學習這個領域的研究可追溯至 50 年代計算機剛發明之初,神經網路中的感知器(perceptron)學習法出現以後,這個領域便不斷地茁壯。隨著目前人工智慧及專家系統的興起,機器學習所扮演的角色日益吃重,它可直接從所使用的例子、事實、描述中自動獲取所要的知識或改進已有的知識,在知識擷取公認是計算機應用的瓶頸之際,機器學習無疑提供了一個有效的解決之道。
機器學習可說是人工智慧研究的核心,因為人類智慧的源頭是由學習而來。機器學習的目的是讓電腦能夠從以往的經驗資料中學習,然後舉一反三地做出正確推斷和預測。只要給予多筆訓練資料,並選擇資料中可以用來分辨的特徵,開始訓練出模型,電腦就可以透過這個模型來做推斷。
我們可以從給定的訓練例子中學習出決策樹這種分類模型,利用節點關係來描述各個屬性對應至分類結果的關係。例如輸入多筆訓練的資料,以判斷什麼狗會咬人,再利用機器學習方法便可歸納出決策樹。當訓練完成後,就可利用決策樹來回答原始資料中沒有的問題,例如中型的黑狗會不會咬人?透過這個決策樹模型,就可以推斷出「會」或「不會」。
目前已提出了相當多的機器學習演算法,其中最常見的是利用已收集到的訓練例子來學習。而根據這些訓練例子所屬的類別已知與否,學習演算法可分成「監督式學習」(例子輸出分類已知)及「非監督式學習」(例子輸出分類未知)兩種。
在非監督式學習中,主要是從訓練例子的各項屬性資料中自動群聚成數個群組;在監督式學習中,則是從訓練例子的各項屬性資料及其已知所屬類別中,自動形成分類所需的判斷條件或規則。例如給定一組正例及負例,監督式學習會推導出涵蓋所有(或大部分)正例及排除所有(或大部分)負例的規則。若給定的例子不屬正負兩類,而是分屬不同類別,則監督式學習會針對每一類別分別推導出涵蓋所有(或大部分)這類訓練例子的規則。
機器學習策略又可分成「符號型學習策略」及「數值型學習策略」。在符號型學習策略中,訓練例子及所學習出的規則都是以符號表示。例如有一條規則「假如身高為高,則會打籃球」,其中「高」及「會打籃球」就是符號表示。而符號型學習策略根據例子處理方式的不同,又可分成「逐漸式學習策略」及「批次式學習策略」。
逐漸式學習策略在處理訓練例子時,是一個例子處理完畢後再處理下一個,直到所有的例子都處理完為止。因此它學習的方式可視為由下而上,即由例子慢慢往規則演化。批次式學習策略是一起考慮全部例子,先從其中找出適當的概念或規則,也就是由最泛化的可能規則往下搜尋。除了符號型學習策略外,數值型學習策略也相當常見,其中又以神經網路學習為代表。
近年來隨著資訊科技快速的發展,資料處理和儲存更為方便,但也使得想要從中獲取一些隱含且有用的資訊來幫助決策,變得困難。因此發展有效的機制來從大量的資料中快速擷取有用的資訊和知識,廣受大家的討論與研究。
針對這樣的需求,Agrawal 和其工作伙伴提出了「資料挖掘」(data mining)的概念,它結合了資料庫與人工智慧領域而變成一個熱門的研究主題。簡單言之,資料挖掘是為了一個明確的目的,從現存的資料庫中萃取想要的知識或有興趣的模式,因此它和機器學習的觀念密切相關。目前許多組織已使用這項技術於決策上,如超級市場、網路公司、銀行等。
腦力激盪
人腦是由許多的腦細胞所組成,然後利用細胞之間層層的訊號傳遞,完成各種思考及學習的功能。細胞構造相當簡單,卻能做十分複雜的事情。
為了讓電腦具備類似人腦的功能,科學家開始研究並模擬生物神經系統的運作模式,也提出多種類神經網路模型。具體而言,一個類神經網路包含了許多同樣的計算單元,計算單元間由一些線路連結,在這些連結上附有一個權重係數代表連結強度,這些係數決定了這神經網路的行為。
值得注意的是,權重係數是一數值,而非符號式學習的符號。適當權重係數的給定是非常重要的,不當的給定會造成整個神經網路的正確性大幅下降。為了求出適當的權重係數,陸續提出了許多係數自動學習的方法,在不同的神經網路模式下就有不同的方法。
其中最古老且最簡單的是感知器類神經網路模型,只有輸入層和輸出層,不含中介層。而最著名的是倒遞迴(back-propagation)學習策略,通常用來做為分類器使用。最近也有一些類神經網路的延伸研究,如非常熱門的支持向量機(support vector machine)的研究。
總之,類神經網路是目前相當熱門的研究課題,期望以平行處理、有學習能力的類神經網路,達到人類視覺、聽覺、辨識等的表現。
差不多電腦
大家都讀過胡適的〈差不多先生傳〉,雖然差不多先生是在諷刺處事敷衍苟且的態度,但是傳統電腦不是對(1)就是錯(0)的處理程序,似乎是少了一點點「差不多」的彈性。例如 25 歲以下是青年,26 歲就是中年嗎?170 公分以上算高,169 公分就是矮囉?這些問題若由人類來判斷,可能會有不一樣的答案吧。
人類的思維其實是很模糊的,像是經常使用「稍微小聲一點」、「大概是吧」這些詞語,但是電腦有辦法了解這些灰色地帶嗎?為了讓電腦能做這些不明確的判斷,在智慧型系統的開發研究中常會加入模糊(fuzzy)理論。模糊理論是在原本對(1)與錯(0)之間,再多加幾個等級:幾乎對(0.8)、可能對(0.6)、可能錯(0.4)、幾乎錯(0.2),讓電腦判斷的彈性變大,也就能辨別一些語意模糊的情況。
模糊理論是在 1965 年由 Zadeh 教授所提出的,是透過定義隸屬函數(membership function)來界定成員是否隸屬於某個集合。不同於傳統集合只是簡單地把成員做二值化分類,模糊集合利用漸進的方式來模仿人類的想法,也就是根據程度的差別來描述一個集合,代表它對某些曖昧文字的模糊關係,如漂亮、昂貴、大、小等語意字詞。
例如判斷身高是高、中、矮的隸屬函數,每個語意詞分別有一隸屬函數,若現有一學生身高是 168 公分,則根據這隸屬函數可發現屬於高的程度是 0,屬於中等的程度是 0.8,屬於矮的程度是 0.2。當界定模糊集合後,同樣地也能藉由運算及推論方法來做決策,且結果更能反映出事實。目前模糊理論已廣泛地和各個領域相結合。
聽音觀色
近年來,人工智慧最熱門的應用就屬「圖形辨識」及「語音辨識」,也因為從事這方面研究的人非常多,因此形成了自己的研究子領域。由於聽與看是人類兩個相當重要的感官,若電腦能具備這兩種功能,不僅能幫助人類做一些偵測、追蹤的工作,也能讓電腦更有能力與人類溝通,讓人類使用話語、表情、動作、手勢就能與電腦互動。
圖形辨識一般是利用圖形的特徵(如顏色、形狀、位置等)來辨認,另外也常使用一些公式計算出能夠代表圖形的轉換特徵數據,這個數據可以說是圖形的指紋,因此能透過數據間的比對來辨識圖形。而語音辨識是利用語言的特性(如波形、聲調、快慢等)來辨別不同人的聲音、詞語,或把語音轉換成文字。
最佳好幫手
隨著網際網路的興起,利用網路搜尋資料的需求性越來越高。雖然大部分的搜尋引擎都能夠透過關鍵字的比對,得到我們想要的資料,但是如果使用者所給的關鍵字不夠明確,或有特殊的需求限制,就沒有辦法立即得到所期望的結果,仍然必須由人工來蒐集與整理。
為了讓這些繁瑣的工作自動化,近年來發展出智慧型代理人的概念,以電腦程式做為人類和外界服務的仲介,只要告訴代理人你的需求與喜好,智慧型代理人就能利用各種智慧型技術自動擷取及彙整資料、資訊和知識,並做出最妥善的安排。
智慧型代理人應用的範圍相當廣泛,除了前面提到的網際網路外,未來電子商務、教育學習等都是其發揮的舞台,甚至如電影〈獵殺代理人〉(Surrogates)中的「仿生代理人」都可能出現,人類不但可以自己選擇代理人的長相,而且不需出門就能利用代理人上山下海挑戰極限。
了解人工智慧的想法與方法之後,人們相信創造出智慧的可能性是存在的,我們可以樂觀期待藉由人工智慧來改善人類生活。但是如果人工智慧不斷地進步,假以時日是否會像科幻電影或小說所描述的一樣,出現機器人反抗,甚至是統治人類的劇情?
所謂「有一好沒兩好」,人們期待機器人帶來方便,就必須勇敢面對人工智慧所衍生的倫理道德問題。科技與倫理的衝突並不容易解決,但就目前人工智慧發展的現況來看,人們還不需要太過憂心,只要繼續積極地去探索人工智慧的極限與未來,讓人工智慧與人類智慧相輔相成,必能創造人類無窮的福祉。