跳到主要內容

科技大觀園商標

分類項目
Menu

歷史研究再進化 讓AI開闢GIS新出路

109/11/16 瀏覽次數 4106
(圖/Jakob Braun 拍攝,Unsplash)(圖/Jakob Braun 拍攝,Unsplash)
 

當學生們在學習歷史時,課本往往注重於文字敘述,比如介紹到漢武帝,就會寫上他在位時的政績,對漢朝有什麼貢獻,再附上一張後人為他繪製的畫像,然後他就死掉了。接著往下說其他歷史,但其實所謂的「歷史」,是與地理密不可分的。

 

以著名的「關羽華容道埋伏曹操」為例,若是從地圖了解當時狀況,就會知道關羽根本不可能埋伏,因為華容道是曹操的大本營後方,他不可能在勝負尚未分曉前,就在曹操本營設下暗兵,因此可推論這純粹是小說情節。沒有透過地理位置來對歷史融會貫通的情況下,我們可能熟知每個王朝的更迭,卻無法了解它們在歷史上的地理意義,理解上便相對生硬。

 

單憑一字一句,是很難概括整個國家的興衰的,以中國史為例,不同朝代的人們,他們的使用的器械、服儀,都可能因文化或活在不同氣候帶而出現差異。因此在歷史研究方面,現代不乏有人希望透過地理資訊系統(Geographic Information System, GIS)來獲得更全面的了解。但若想以傳統的方式建立,是一件非常累人的事情。

 

耗時費力的手動建模

 

所謂傳統的方式,就是以手動的方式,將文字或圖案構成的歷史素材輸入到GIS中,慢慢重新建構一個古代文明;但透過人工的方式土法煉鋼非常耗時與昂貴,過去有許多學者都希望以古地圖或舊照片來重現某個時代的樣貌,但都礙於手動的方式太過繁瑣且耗時,因此都只能投以大量時間換得小小的成果。事實上,過去20年間,許多有關臺灣歷史GIS的論文,都將心力花在了人工調查古往今來地圖的詳細變化上,這也可以看出要用過去的素材來呈現一張現代地圖,是多麼困難的事。

 

但隨著人工智慧(AI)的普及,也有學者將上述繁瑣的過程交給AI處理,比方說畢業於台灣大學資訊工程系的德國馬克斯普朗克科學史研究所研究員陳詩沛,便以《中國地方誌》為藍本,用以研究中國歷史圖像的Web GIS,從中選取了6萬多張視覺圖片,使用機器學習的方式,將圖片一一標記,更創建了Images-in-Map(IIM)跟Maps-in-Map(MIM)模式,減少手動的麻煩。

 
所謂IMM模式,就是以中國做為底圖,在輸入關鍵字後,便可直接查看其分布的樣貌。如上圖以搜「人物(Human)」為例,地圖上立即顯示出不同地區人民的穿著。(圖/陳詩沛提供)所謂IMM模式,就是以中國做為底圖,在輸入關鍵字後,便可直接查看其分布的樣貌。如上圖以搜「人物(Human)」為例,地圖上立即顯示出不同地區人民的穿著。(圖/陳詩沛提供)
若搜索結果中的圖像與空間或是自然地理相關,則如上圖顯示MIM模式。搜索結果將會覆蓋在中國土地測量圖(Land Survey Maps of China)上,以提供更多背景訊息。(圖/陳詩沛提供)若搜索結果中的圖像與空間或是自然地理相關,則如上圖顯示MIM模式。搜索結果將會覆蓋在中國土地測量圖(Land Survey Maps of China)上,以提供更多背景訊息。(圖/陳詩沛提供)
 

元數據與卷積神經網路

 

這項研究過程中,需要將雜亂的資訊系統性地整合,且需要將資料標籤化,這時元數據(metadata)的概念便很重要。所謂的元數據,可以理解成「數據的數據」。以圖書館為例,現代的圖書館多半已經數位化了,但早期想借書的人們,都是從卡片目錄中搜索需要的書籍,卡片上清楚標示著作者、標題、主題等資訊,這種「將數據整合起來的數據」,便是所謂的元數據。

 

說回史料整合,中國歷史悠久,未曾有人將其龐大的史料標籤化,若是走回手動標籤化的老路,又將遭遇一場耗時傷神的災難,但卷積神經網路(Convolutional neural network, CNN)卻能有效解決這樣的問題。

它是深度神經網路(Deep Neural Network)這門科學中的強大戰力,對於識別圖片的精準度之高,甚至超越人類。但在探究其原理之前,我們必須回到根本:電腦如何「看」一張圖片?

 

基本上圖片都是以一格一格的畫素組成,每種顏色代表著不同的數值,最後才能將圖片拼湊出來。以下圖的「X」為例,正是以黑與白兩色所組成,其中黑色的數值為-1、白色為1,一般電腦在識別這兩張圖片時,並不會將其歸類為同一張圖片。

 
(圖/Gitbook截圖,資料來源:Brandon Rohrer,Youtube影片 ”How Convolutional Neural Networks work”)(圖/Gitbook截圖,資料來源:Brandon Rohrer,Youtube影片 ”How Convolutional Neural Networks work”)
 

但若是卷積神經網路出馬,就能找到兩者的相似之處,進而給予它們相似值,它會比對圖片中的任何地方,並將圖片中各種像素組合交叉計算,告訴我們圖片裡有多少相符的特徵。得出的結果中,數值越接近 1 的局部和該特徵越相符,而數值接近 0 的局部幾乎沒有任何相似度可言。這樣,電腦便可以判斷出這兩張圖案是否為相似的物體。

 

這樣的技術剛好適用於漸漸變化的歷史,以浙江省餘姚市的地圖做為例子,卷積神經網路可將此區2018年的衛星圖與1916年的陸測圖、1781年的《餘姚地方誌》地圖進行比對,看出相對位置的描述皆大致相符。

 
2018年與1916年的餘姚市地圖,透過餘姚江分成兩部分。卷積神經網路也針對此特徵,發現兩者的相似之處。(圖/陳詩沛提供)2018年與1916年的餘姚市地圖,透過餘姚江分成兩部分。卷積神經網路也針對此特徵,發現兩者的相似之處。(圖/陳詩沛提供)
 

但若要再細緻一點,觀察歷代以來城市準確疆界的演變,就很不容易了,因為古代的描繪方式多少會失真。古人流傳下來的地方誌雖然較不準確,但因呈現的內容詳細多元(包含河流、湖泊、山、軍事基地、城牆、道路、大門、建築等等),所以一旦經過Web GIS的技術將不同時代的地圖堆疊、整合,便可以補足僅看單一一種地圖的缺漏。例如陸測圖當時是為軍事用途而存在,因此許多細節僅以簡潔的符號做為標記,而這些符號就可藉地方誌中所呈現的訊息來輔助解讀。如此一來,古今的資訊之間就更沒有阻隔且更為完整,也幫助人們更深入了解各區域的歷史文化脈絡。

 

總結來說,Web GIS為歷史學家創建了中國地方誌的大量圖像集,在數月內即完成定義16項標籤,並利用人工標籤了63,489張圖像,將其進行分類。另外,陳詩沛團隊僅利用210張圖像(共9類別),就成功訓練出類神經網路模型,進一步完成了半自動標記。這項創舉幫助了研究人員從大量的中國地方誌中建構空間圖像,協助解答甚至提出新的研究問題,讓歷史研究有了新的思維。

 

過去研究歷史,只能著重於文本,但如今已經可以利用機器學習擴大研究範圍,處理大量圖像、視覺材料、圖像資訊及辨別空間屬性等。不過現在機器學習應用技術成本還是太高,若未來成本可以大幅降低,就可以為Web GIS系統帶來更大量大型的圖像識別、聚類及圖像搜索,為研究人員提供更多探索的可能性,並為歷史研究開闢新的出路。

資料來源
  • 科技部108年度「科轉計畫:前沿科技轉化暨教育應用推廣」專案計畫
創用 CC 授權條款 姓名標示─非商業性─禁止改作

本著作係採用 創用 CC 姓名標示─非商業性─禁止改作 3.0 台灣 授權條款 授權.

本授權條款允許使用者重製、散布、傳輸著作,但不得為商業目的之使用,亦不得修改該著作。 使用時必須按照著作人指定的方式表彰其姓名。
閱讀授權標章授權條款法律文字

OPEN
回頂部