跳到主要內容

科技大觀園商標

分類項目
Menu

哆啦A夢的「翻譯蒟蒻」–同步口譯系統

97/09/10 瀏覽次數 17363
日本卡通〈哆啦A夢〉中,有一個叫「翻譯蒟蒻」的道具,吃下它的人,說出和聽到的語言可以轉譯成對話雙方聽得懂的語言,因此可以和不同語系的人溝通。雖然這種道具還是夢想,但世界各國都積極投入機器同步口譯的研發。

國內成功大學電機系王駿發教授的研究團隊,也從 1999 年開始投入「語音轉語音機器翻譯系統」(speech to speech machine translation, S2ST)的研究。目前他們已經可以做出簡單的國語、臺語及英語 3 語同步轉譯系統,他們的研究更入圍 2002 年由 HP 惠普科技與遠東經濟評論共同舉辦的「第3屆亞洲盃青年發明家大賽」(Young Inventors Awards, YIA)前 10 名,也是臺灣參賽隊伍唯一入圍者。

身為該研究團隊一員的博士生林順傑指出,目前世界上的常用語言,包括英文、日文、中文等,起碼有 11 種,亞洲常用的也有 8、9 種之多。無論商務、旅遊、學習,國人常會接觸到外籍人士。王駿發教授表示,不同語系「文字」間的翻譯,目前已經有許多翻譯軟體、線上字典等資源可以利用。但在「語音」方面,國內還沒有即時且正確率高的系統。

王教授團隊的研究從中文、英文及臺語 3 種語言的互相轉譯出發,目前研究發展至單晶片系統雛形。關於使用的方法,簡單地說,他們運用語音、語詞的特徵,把發話者的句子拆解成多個詞彙,再重新組合,並找出最佳的翻譯方式。在他們的研究中,不只建立詞句翻譯的「資料庫」,更考慮句型倒裝等問題,讓翻譯更加人性化。

在他們的「人云譯云」翻譯雛形系統中,以旅館訂房為例測試。林順傑舉例,當旅客說:「Is room service still available?」一開始會轉換成「有……嗎?-房間/客房-服務-還-有」,再經由最佳化程序和句型配對,找出機率最大的組合,翻譯出「還有客房服務嗎?」王教授補充說明,設計的過程也考慮人的說話習慣,「我要訂一間有浴缸的雙人房」和「我要訂一間雙人房,還要有浴缸」翻譯出來的結果一樣。

翻譯人才難求,同步口譯的價格更是昂貴。日本電信電話株式會社(NTT)預估,2010 年以後多語言雙向翻譯市場將急速擴大,之後 15 年的商機可能達到 7.8 兆日圓(約 2.2 億新台幣)。

王教授強調,語音轉譯重點在「正確率」和「同步性」,還有某些特殊語詞(例如多重意義)的解讀。國內某些大學也正在研發類似的語音翻譯軟體,但有使用者測試後說,翻譯的速度不夠快,正確率也不高。雖然某國際大廠已經有語言辨識軟體,正確率可以達到 90%,但王教授認為不夠。「寫 1,000 個字就錯 100 個字,光抓錯字就跟重寫差不多了。」

未來,王教授仍將繼續語言翻譯系統的研究,朝向「信、達、雅」的目標修正。他認為,若能結合時下風行的通訊軟體(如 MSN、Skype),或是 VOIP 網路電話,一定有助於大量推廣。王教授還想,這套系統也可以結合玩具、有聲書,他笑著說,像「哈利波特」之類的暢銷書一上市,如果發行有聲 CD,配合這套系統,臺灣書迷或許就不必等中譯本了。

深度閱讀
  1. Yuqing Gao, Bowen Zhou, Liang Gu, Ruhi Sarikaya, Hong-Kwang Kuo, A-V.I.Rosti, Mohamed Afify, Weizhong Zhu (2006) IBM MASTOR: Multilingual automatic speech-to-speech translator, ICASSP Proceedings5, 1205-1208.
OPEN
回頂部