跳到主要內容

科技大觀園商標

分類項目
Menu

AI 助陣臺語教學:TAIDE 機器人如何提升學習成效

113/10/23 瀏覽次數 974

語言消失的速度非常快。

國立臺南大學資訊工程學系李健興教授回憶,小時候,學校、課本並沒有教臺語,只是跟著母親、阿嬤、家裡人講啊講,臺語就自然而然地成為他最熟悉也最親切的語言。

沒想到,當他接觸到現在的大學生,驚覺情況不對。在當代學子求學歷程中,雖然學校有專門課堂、有專業語言教材,每個禮拜至少有一節課,且持續六年的時間,但是,當要講臺語,多數的學生能聽懂的已不容易,能講的更是稀奇。

臺語使用人口的快速縮減,不只是李教授的親身經驗而已。根據文化部的《國家語言發展報告》指出,若將文化部的調查數據對照聯合國教科文組織語言活力指標的「不同世代語言傳承指標」,臺語便屬於「明確危險」的等級。

「臺語作為本土語言,乘載豐富的文化價值與歷史。」李健興教授認為,讓學子在年幼時接觸臺語,不只是學習一種語言,更是學習在地文化。然而,在國際化的時代,對家長來說,孩子的學習時間有限,當「學習英語」跟「學習臺語」拉扯,往往會選擇讓孩子以英文優先。久而久之,學子們便英文流利,但是臺語卻不太行。

既然如此,那麼能不能讓學子們在學習臺語的同時,也同時學習英文呢?

秉持著對於臺語文化傳承的關注,以及對於新興科技的期待,李教授帶領著國立臺南大學的團隊,以機器人作為語言學習的工具,設計了「TAIDE 臺英語機器人」。TAIDE 臺英語機器人可以和國小學子互動,提升國小學生學習臺語的動機,也增加練習生活化英語的機會。但具體是怎麼做到的呢?

 

TAIDE 臺英語機器人,讓學童在互動遊戲中學習

鏡頭切換到在臺南的國小示範場域。

教室裡,國小學童正在使用 TAIDE 臺英語機器人,第一次開口講臺語的學童們,完全不必擔心他們講得不好會被老師或同學笑,因為在與機器人互動的過程中,機器人不會笑他,反而可以藉由學童的發音給予評分,讓學童知道自己的發音是否精準。為了得到更好的評分,學童一次又一次學習、調整、練習,在得到分數時或開心歡呼或扼腕嘆息,簡直像在玩電動遊戲。

而當學童講了「臺灣的香蕉很好吃」,TAIDE 臺英語機器人便會透過辨識,顯示出香蕉的畫面,與學童來回互動。也不只是圖片回應而已,當學童說了臺語句子,TAIDE 臺英語機器人,甚至能夠以英語回答,讓學童們在練習臺語的同時,也對英語更加熟悉。

在有了 TAIDE 臺英語機器人的課室裡,學語言不再只是坐在教室、安靜聽著錄音帶或光碟片,連自己有沒有唸對都不太清楚的學習過程,而是透過開口說語言、和 TAIDE臺英語機器人互動,在互動的過程中,自然而然熟悉並使用語言。

而如此互動性高、辨識度高、語言切換流利的 TAIDE 臺英語機器人,究竟是怎麼開發出來的呢?

臺南市仁德國小作為 TAIDE 機器人示範場域

臺南市仁德國小作為 TAIDE 機器人示範場域。李健興教授(後排左一)、仁德國小校長李培瑜(前排左二)及臺南大學校長陳惠萍(後排左四)。圖片來源:李健興教授提供

 

結合關鍵模組,高互動性、辨識能力、多樣語言的機器人

「TAIDE 臺英語機器人的核心架構包括幾個關鍵模組,」李健興教授進一步解釋,首先,要讓機器能夠聽得懂學童的發音,仰賴的是語音處理模組,負責語音識別與合成,透過深度學習技術準確辨識臺語和英語語音,並生成自然的語音回應,提升人機互動的流暢性。

其次,為了能回饋學童的發音是否精準,透過的是自然語言處理模組(natural language processing, NLP)採用基於 transformer 的模型,如,Sentence-BERT,用於計算語義相似度,確保機器人能理解學生的輸入並提供即時智慧的回饋。

此外,當學童說到香蕉,畫面上便出現香蕉的互動功能,得依靠 TAIDE 臺英語機器人內建的生成式 AI 技術。即時生成學習內容的相關影像和知識圖,增強互動性和學習趣味。

系統還支持多模態輸入,包括聲音、影像和文字,學童可以透過多樣化的方式與機器人互動,無論是臺語、英語、日語或華語,TAIDE 臺英語機器人都能處理,提升學習體驗。另外,整合 Meta AI 的 Universal Speech Translator(UST)通用話語翻譯技術,也讓機器人能精確翻譯臺語與英語,進一步提升雙語學習的效率。

 

語料庫的建立,得從現在積極蒐集

TAIDE 臺英語機器人以人機共學的方式,讓學童自然而然的學習語言,此外,也有機會藉由機器學習,蒐集不同地區的腔調。

在早期的教學場域中,都是以同一套錄音帶、光碟,讓所有地區的學童學習統一的語言發音,但語言畢竟是活東西,不同的地方有不同腔調,透過機器學習,便有望整理出臺南腔、高雄腔、臺北腔,讓語言保有在地性和美感。

不過,要達到那一步,還需克服語料庫建立的難題。

最大的難題,是語料的蒐集期限迫在眉睫。目前臺語使用人口不斷流失,三十年、五十年後,現今的臺語使用者逐漸凋零,語言也將隨之凋零,語料蒐集便更加不容易。因此,蒐集語料必須立刻進行、加快速度。

其二,是計算資源成本很高,需要各方支持。如今可以透過與 TAIDE 臺英語機器人互動,當學童們回家後藉由與阿公阿嬤、爸爸媽媽用臺語聊天互動,並透過跟手機、平板、電腦互動,在生活中產生語料。不過,這些在生活中產生出來的語料,仍須透過大量資料處理,以解決個資隱私的問題,李健興教授點出現實考量,「現在光是一個月的計算資源使用費,便已經用掉超過 30 萬元了。」

李健興教授在國小教室示範使用TAIDE 聊天機器人

李健興教授在國小教室示範使用TAIDE 聊天機器人。圖片來源:李健興教授提供

面對 TAIDE 臺英語機器人的發展挑戰,李教授並不悲觀,「以臺灣目前的硬體環境、軟體人才然後目前投入的狀況,只要提供足夠資源,應該有能力、也有機會。」

大膽想像下個十年,在未來,語言的學習不再困難,只要透過 TAIDE 臺英語機器人,在遊戲之間,在地且道地的語言便能在學童生命歷程中萌芽,也更能回到家裡頭,和長輩們用著他們最熟悉的語言自在對話。

 

資料來源
  1. 採訪國立臺南大學資訊工程學系李健興教授
  2. 文化部 國家語言發展報告(112年3月6日修正)
創用 CC 授權條款 姓名標示─非商業性─禁止改作

本著作係採用 創用 CC 姓名標示─非商業性─禁止改作 3.0 台灣 授權條款 授權.

本授權條款允許使用者重製、散布、傳輸著作,但不得為商業目的之使用,亦不得修改該著作。 使用時必須按照著作人指定的方式表彰其姓名。
閱讀授權標章授權條款法律文字

OPEN
回頂部