從分析到創作–談人工智慧應用於音樂的想像與真實|最新文章

:::

facebook twitter line 中列印書籤

:::

從分析到創作–談人工智慧應用於音樂的想像與真實

107/06/20 5277

蘇黎｜中央研究院資訊科學研究所助研究員

音樂是人類非常重要的能力，而且十分主觀。人工智慧在音樂領域的應用，大家會有非常多的想像。

人工智慧在音樂領域的應用

人工智慧在音樂上可以做什麼？中央研究院資訊科學研究所助研究員蘇黎說：「希望機器具備如音樂家一般理解音樂的能力。」大致可以分為四個面向：聆聽、演奏、評論、創作。

在聆聽方面，相傳莫札特年少時聽到教堂音樂，回去後就能默記全曲並寫成樂譜，現在，人工智慧也做得到，這種技術稱為「自動採譜技術」。首先把物理的聲音訊號轉換成數學模式後，透過人工智慧技術，就能輸出MIDI（樂器數位介面），其中記錄了時間、音符、音高、聲部、樂器等資訊，最後再轉成人類熟悉的樂譜。

自動採譜技術對於很多口耳相傳卻沒有樂譜的音樂來說，有很大的幫助，它還能夠記下許多現場演奏者的音樂特徵，例如歌手的抖音習慣。

自動採譜技術把物理的聲音訊號轉換成數學模式後，透過人工智慧技術，就能輸出MIDI（樂器數位介面），其中記錄了時間、音符、音高、聲部、樂器等資訊，最後再轉成人類熟悉的樂譜（stevepb,pixabay）。

蘇黎以他所研究的布農族八部合音為例，它有很多與西方古典音樂不同的特徵，像是有很多聲部；還有微分音，一般鋼琴有十二個音階，微分音的音程在半音以下；以及泛音唱法，透過聲帶、頭部共振，一個人可以唱出兩個音調。運用自動採譜技術，人工智慧做出來的結果，與民族音樂專家的結果相符。

除了聆聽，人工智慧還可以演奏，即時偵測現在演奏到哪裡，跟上人類演奏者的節拍。也可以校正人類演唱者的音高，卻又保留演唱者的風格，而不會感到不自然，就是「走音救星」。最後還能作曲、編曲，例如，類似把圖片轉換成梵谷風的風格轉換技術，人工智慧也可以把月光奏鳴曲轉成巴哈風格。

不過，人工智慧在音樂領域上的應用有其困難。人工智慧系統包含的要素有資料（輸入）、標記（輸出）、類神經網路和目標函數。目前最缺的就是「考古題」，即使有資料，卻沒有標記。在音樂領域尤其難，例如小提琴大師海飛茲的獨奏，雖然有歷史錄音，但也要有人去做標記後才能訓練，但標記很費時間且需要高度專業人才。

人工智慧取代人類價值？

自從人工智慧出現，特別是學會創作以後，人類似乎就產生了焦慮感。蘇黎把此類比為「藝術創作天動說」：以往可能認為，人類才是藝術創作的中心，機器創作會毀壞藝術價值，這種衝擊就好像人類一直以為地球是宇宙中心，卻發現地球其實是繞著太陽運行的。另外，也有人認為機器不會累，可以源源不斷地創作音樂或做其他工作，就像是工業革命時人們所擔心的「永動機」，害怕工作被機器搶走，人類被機器取代。

蘇黎指出，人工智慧的創作是模仿人類神經元迴路，但在創作過程中，人類大腦到底是如何運作的，其實我們不知道。就像物理學家費曼提出的「草包族科學」（cargo cult science），二戰後一些原始部落為了吸引運輸機補給，試圖建造一座外表看似機場、實際上卻沒有機場功能的設施，以吸引飛機降落。

因此，人工智慧真的會取代或毀壞某些價值嗎？至少目前不會。蘇黎說：「研究人工智慧技術不是要取代或毀壞，而是做為一種工具。」運用人工智慧這種工具，可以讓繁雜的工作自動化以節省時間，專家就有更多時間去創作，或去做更多有價值的事情。

資料來源

科技部補助｢科學短講（Tech Talk）計畫｣執行團隊整理

音樂(14) 人工智慧(169)

從分析到創作–談人工智慧應用於音樂的想像與真實

推薦文章