機器透過互相砥礪來學習創造:對抗式學習

 
2018/06/15 李宏毅 | 臺灣大學電機工程學系助理教授     211
 
活動(演講)時間: 2018/03/11
 

你可能覺得人類與機器最大的不同,在於人類會創作,就算是人工智慧,機器也只是擅長找規則,想要創作可能還要很久,對吧?這可不一定,台灣大學電機工程系助理教授李宏毅說:「機器可以藉由互相砥礪學會創造。」這個新的機器學習技術就是對抗式學習。

 

互相較勁,共同成長

 

今日的人工智慧已經能夠根據資料歸納出規則,例如我們可以給機器看一堆貓跟狗的照片,它就能分辨貓跟狗的不同。但科學家希望人工智慧能夠更上層樓:能不能根據所學到的規則,把一隻貓畫出來?

 

李宏毅解釋,想要讓機器學會創作,自然要有一個機器人負責創作,我們稱之為生成者。如果採用以往的機器學習技術,我們會提供許多範例給機器,希望機器學習後就能夠自己畫出來,然而這種機器所畫出來的結果,只會跟其中一個範例長得一模一樣,「只能算是抄襲,而非創作。」

 

為了讓生成者真的學會創造,就不能讓它看到範例,那它要如何知道怎麼創作呢?李宏毅說:「這時我們需要引入一個新的角色,稱為鑑別者。」鑑別者是另一個機器人,它不負責創作,但它看過很多範例,能夠歸納出規則,再與生成者的創作比對,如此生成者就知道自己的問題在哪裡。

 

李宏毅以創作二次元人物頭像為例:一開始生成者的創作可能只是雜訊,鑑別者發現每張圖片都有兩個圈圈(眼睛),但生成者的沒有。接著,生成者為了通過鑑別者的考驗,就必須加上兩個眼睛。不過,鑑別者會持續學習進化,找出新的規則來批評生成者的圖片,比如圖片是黑白的,於是生成者又針對新的批評做改善,為圖片加上顏色。如此反覆循環,最後產生水汪汪的大眼睛.由於生成者從未看過範例,所以它無法抄襲,而能創造新人物。

 

總而言之,鑑別者負責批評生成者;生成者要讓鑑別者無法批評。李宏毅說,兩者之間的關係就像日本動漫裡的名言「寫做敵人,唸做朋友」。表面上是互相對抗,實際上卻因為互相砥礪而越來越強。

 

更多新的想像

 

這種技術可以應用在很多風格轉換的情況。例如把風景畫重繪成梵谷的畫風,這裡的鑑別者負責觀察梵谷畫作範例,生成者則負責重畫。或者,如同網路上提供的惡搞人像app,把人像變性、變老、變金髮。如果用在語音的風格轉換上,例如把男聲變女聲,那麼「柯南變聲器可能已經不遠了!」

 

若應用在文字風格的轉換方面,可以把負面句子轉成正面句子,李宏毅開玩笑說:「這很有用,如果你的主管說話很刻薄,你可以在耳機上裝這個軟體,你的人生就會過得很開心。」

 

最具體的應用是翻譯。以往用的技術是督導式學習,讓人類老師去教導機器,但機器每次學新的語言,都需要人類老師重新教一次。對抗式學習則不需要人類老師,而是把每種語言視為一種「風格」,然後做風格轉換。

 

聽起來似乎很荒謬,事實上已經正在發生。以最近FB所釋出來的資料來看,發現用對抗式學習讓機器自己學翻譯,跟人類教機器10萬句的結果,兩者表現是一樣好。也就是說,除非你可以教機器超過10萬句,不然機器自己學的結果,不會比人類教導差。

 

如今我們有了對抗式學習技術讓機器學會創造,將可以為人工智慧帶來新的想像。

 
【整理|科學人】
 
延伸閱讀:AI影像真假難辨,《科學人》2018年5月:http://sa.ylib.com/MagArticle.aspx?Unit=newscan&id=3937