跳到主要內容

科技大觀園商標

分類項目
Menu

臺灣需要自己的AI嗎?從主權AI到在地語言模型

115/06/30 瀏覽次數 29

也許你已經有過類似經驗。比如,當你跟AI問起「辦桌」、「搶孤」或「炸寒單」等等的臺灣傳統文化,它的解釋不但不夠完整,甚至出現了錯誤資訊;又或者,當你輸入「這個價格有點盤」,AI卻無法理解「盤」在臺灣日常用語中,究竟是什麼意思。
 
隨著生成式AI快速進展,如今愈來愈多人透過AI查找資訊、學習知識,甚至是做決策。但是,如果這些系統主要以國外資料訓練,便會對臺灣的歷史、文化和語言脈絡了解有限,就可能產生理解落差——上述的狀況便會是常見結果。
 
也許乍看之下影響不大,但久而久之,我們每天接觸的資訊,甚至對自身文化的認識,都可能因為外部觀點影響,而逐漸脫離了「臺灣」本身,甚至,更將影響到經濟發展、產業競爭與國家安全。
 
因此,一個新概念便逐漸受到各國重視,那就是——「主權AI(Sovereign AI)」。

主權AI,重點在於保有國家的自主能力

「主權AI講的並不是政治上的主權,而是國家是否具備自主發展、管理與運用人工智慧的能力。」臺灣AI卓越中心(AICoE)總召集人、長庚大學智慧運算學院院長許永真特聘教授說明,許多人以為AI只是科技公司的產品,但事實上,當AI逐漸成為知識生產、資訊傳播與產業創新的基礎設施後,它的重要性已經接近電力、網路或交通系統了。
 
他進一步分享,主權AI的核心概念,在於讓一個國家或地區,能夠掌握與自身社會相關的重要資料、運算資源與AI技術,並且,確保這些系統能夠反映本地的語言、文化與價值觀。這也是為什麼,近年來,包括美國、中國、日本、法國、新加坡等國家,都陸續投入資源,發展符合自身需求的大型語言模型,便是希望能在全球AI競爭中,仍保有自主能力。
 
許永真特聘教授更以2026年6月的新聞為例。AI新創Anthropic發表最新模型Fable 5跟Mythos 5後,立即收到了美國商務部的出口管制令,美國政府以國安為由,限制美國境外及境內的所有外國人存取,隨後,Anthropic主動對所有客戶暫時中止了這兩款模型的服務。許永真特聘教授解釋,假使任一國家,剛好應用此模型在控制飛彈、電力等等的重要場域,然而雲端供應端(或原廠)可以基於任何理由突然終止服務,而這對國家來說,後果將不堪設想,「因此為了國家韌性,主權AI非做不可。」
 
在說明主權AI時,許永真特聘教授分享了與中央研究院資訊服務處陳伶志處長的共同研究結果。其中,主權AI可比擬成一座神殿,如果要能順利撐起其建築架構,則必須配有四大重要支柱,分別是以資料為基石、以模型為核心、以算力為肌肉、以基礎建設為骨架。

主權AI可比擬成一座神殿,以資料為基石、以模型為核心、以算力為肌肉、以基礎建設為骨架,此四大重要支柱撐起其建築架構。(圖片來源中央研究院資訊服務處陳伶志處長、編輯團隊重製)

主權AI可比擬成一座神殿,以資料為基石、以模型為核心、以算力為肌肉、以基礎建設為骨架,此四大重要支柱撐起其建築架構。(圖片來源中央研究院資訊服務處陳伶志處長、編輯團隊重製)

由此架構來看現階段的臺灣,目前臺灣強項在於算力與基礎建設,而在資料與模型部分,則尚未取得商業上的成功。然而對臺灣而言,主權AI的意義尤其重要。
 
臺灣不僅使用繁體中文,還擁有閩南語、客語及多元原住民族語言,以及獨特的歷史發展與社會文化脈絡。許永真特聘教授認為,如果未來人們愈來愈依賴AI獲取知識與資訊,那麼AI是否真正理解臺灣、是否能正確回應臺灣社會的需求,將成為關鍵課題。
 
而除了文化與語言因素,資料安全也是重要考量。
 
隨著AI逐漸導入政府治理、醫療照護、金融服務及企業研發等領域,許多應用都涉及了敏感資訊。實務上來講,如果所有資料都必須送往海外平臺處理,不僅可能面臨法規與隱私風險,也會增加對外部技術的依賴。
 
根基於此,許永真特聘教授認為,未來AI不只是聊天工具,更將是支撐產業創新與公共服務的重要基礎設施,「國家必須保有一定程度的自主能力,才能在技術快速變動的環境中維持韌性。」

許永真特聘教授認為,發展TAIDE的目的,並不是要和國際科技巨頭一較高下,而是希望讓臺灣擁有自己的AI基礎建設。(圖片來源/TAIDE官網)

許永真特聘教授認為,發展TAIDE的目的,並不是要和國際科技巨頭一較高下,而是希望讓臺灣擁有自己的AI基礎建設。(圖片來源/TAIDE官網)

在地語言模型TAIDE,更了解臺灣的人工智慧

如果說主權AI是一個目標,那麼近年備受關注的臺版「可信任生成式AI對話引擎」(Trustworthy AI Dialogue Engine, TAIDE),就是臺灣朝這個目標邁出的重要一步。
 
想像一下,當你問AI「臺南牛肉湯為什麼有名?」、「什麼是媽祖遶境?」或是「勞保和國民年金有什麼不同?」如果AI對臺灣的歷史文化、社會制度和日常用語不夠熟悉,所提供的回答便可能流於表面,甚至出現錯誤資訊。但如果AI從小「讀」過大量臺灣的資料,理解繁體中文的語言習慣,也認識臺灣的法規制度和社會文化脈絡,它給出的答案,自然會更貼近臺灣人的需求。
 
而在地語言模型TAIDE,正是以這樣的理念發展而成。作為臺灣的重要在地語言模型計畫,TAIDE透過繁體中文資料、臺灣知識內容以及本土應用情境進行訓練,目的是為了打造出更了解臺灣的人工智慧。
 
「許多人談到大型語言模型時,往往只看到聊天機器人的功能,但真正重要的,其實是背後所累積的能力。」許永真特聘教授認為,發展TAIDE的目的,並不是要和國際科技巨頭一較高下,而是希望讓臺灣擁有自己的AI基礎建設——就像蓋道路、建電網一樣,當未來各行各業都需要AI協助時,臺灣也必須具備自主發展與運用這項技術的能力。
 
許永真特聘教授也分享到,在資源有限的狀況下,TAIDE並不是從零開始打造。相反地,它是建立在全球開源技術的基礎上,再加入臺灣自己的資料與知識進行訓練。簡而言之,這就像聘請一位已經受過良好教育的人才,再讓他深入認識臺灣的歷史、文化、法律與產業特色,進而成為更適合在地需求的專家。
 
不過,一個好的AI,成為「懂很多」的專家,就可以了嗎?
 
近年來,生成式AI的確展現了驚人的能力,但是,許多人也發現,AI有時會一本正經地說出錯誤資訊,甚至產生偏見、歧視或不實內容。於是當AI逐漸進入教育、醫療、金融甚至政府服務等重要領域,人們開始關心的,已不只是「AI能做什麼」,而是「AI是否值得信任」。
 
這也是近年人工智慧領域相當重要的課題──可信任AI(Trustworthy AI)。
 
可信任AI並不是要讓AI永遠不犯錯,而是讓AI在設計、開發與使用的過程中,符合安全、透明、公平、隱私保護等原則,同時讓使用者知道它如何運作,並且理解其產生結果的依據,許永真特聘教授解釋,「如果一個AI能力很強,但沒有人敢用、也不知道它會不會出錯、能不能信任,那麼它的價值其實十分有限。」
 
許永真特聘教授認為,隨著AI逐漸成為社會的重要基礎設施,「可信任」將和「高效能」同樣重要。
 
從現實層面來講,當國際各國要採用非本國所開發的大型語言模型時,其資料來源、治理機制、法規環境與使用條件等,便會隨著開發國家的不同,而有不同標準,同時,這也將影響了「使用該國開源模型是否會造成重大危機」風險程度。根基於此,「可信任」便將是臺灣是否能加入AI生態系的競爭基礎。

未來的國家競爭力,來自於解決真實世界的難題

而當各國都在投入主權AI、發展自己的大型語言模型時,臺灣是否有機會在這場全球AI競賽中占有一席之地呢?許永真特聘教授認為,答案是肯定的,不過臺灣的優勢未必在於打造全球最大的模型,而是在於找到自己的定位。
 
「AI不是單一產品,而是一個產業生態系。」許永真特聘教授認為,未來各國競爭的重點,不只是誰的模型參數比較多,而是誰能將AI真正導入產業與社會,創造實際價值。
 
而以臺灣來說,智慧製造、智慧醫療、智慧交通以及政府數位服務等領域,都具備發展AI應用的良好基礎;如果能夠結合既有產業優勢與在地AI技術,便有機會發展出具有臺灣特色的解決方案。
 
他也認為,臺灣發展AI最大的資產之一,其實是人才。從半導體工程師、軟體開發者,到醫療、教育、製造等各領域專家,臺灣擁有跨領域合作的能量。未來AI的價值,不僅來自技術本身,更將來自人們如何運用它,以解決真實世界的問題。
 
因此,培養兼具科技能力與領域知識的人才,將是維持競爭力的重要關鍵。
 
回顧過去,臺灣曾在個人電腦、網際網路與智慧手機等科技浪潮中,建立起自己的位置;如今面對AI時代,挑戰雖然更大,機會也同樣存在。許永真特聘教授認為,發展主權AI、建立可信任AI,以及培養在地人才與應用能力,都是為了讓臺灣在下一波科技變革中,掌握更多主動權,並且能在世界改變的過程中,依然能夠用自己的語言、自己的價值與自己的創新能力,參與未來,並且創造未來。

資料來源

臺灣AI卓越中心(AICoE)總召集人、長庚大學智慧運算學院院長許永真特聘教授

OPEN
回頂部