透過自動錄音機架設,可大幅提升生態調查的效率。圖片來源:農業部生物多樣性研究所提供
週末想遠離塵囂,投進大自然的懷抱,走在風景優美的森林中,聽著蟲鳴鳥叫,你是否會好奇「只聞其聲,不見其影」的是哪一種鳥類?這時候,或許可以讓 AI 告訴你。
AI 語音辨識是近幾年最蓬勃發展的技術,近幾年更被用於生態調查,透過分辨不同叫聲,來辨識不同地區有哪些生物,是生態調查中不可缺少的一環。透過長期監測野生動物的聲音,可以了解其數量變化和分布狀況,還可研究牠們的行為模式,例如求偶、育雛、捕食。對於瀕危野生動物,還能透過聲音監測其生存狀況,並採取相應的保護措施。
農業部生物多樣性研究所(簡稱生多所)開發臺灣第一套「生物音智慧辨識與標記系統」(Sound Identification and Labeling Intelligence for Creatures,簡稱SILIC),可辨識超過 200 種動物的聲音。究竟其原理為何?自 2019 年啟動 SILIC 計畫的生多所吳世鴻副研究員,親自為大家解答,並分享未來在生態調查上,還有哪些創新應用。
用自動錄音機取代人力,快速建立生物多樣性監測數據
吳世鴻副研究員表示,生態調查是一種科學研究方法,用於了解特定區域內生物的多樣性和生態系統的狀況和趨勢。這種調查通常包括記錄和分析各種生物群落的組成,例如植物、動物、微生物等,並探討生物和環境以及人類活動間的交互作用。
然而,生態調查並不是一件簡單的事情,目前大多仰賴專業人員到現場進行調查,需要耗費大量的人力、時間與金錢,累積資料的速度緩慢,因此如何提高效率,成為生態調查的共同目標。
儘管目前有紅外線自動相機可以代替專業人員長期在野外拍攝動物,但相機視角範圍有限,大多是針對地面活動的動物。對於鳥類這些在樹上活動的動物,或許可以採用新興發展的被動式聲學監測系統(Passive Acoustic Monitoring,PAM)。PAM 的作法是以自動錄音機在野外自動錄音,並從錄音資料中依據聲音辨識出物種,對任何可以發出聲音的動物,例如包含鳥類、昆蟲、野獸等都適用。
由於自動錄音機的架設與操作方式簡單,非專業人員也能使用,可以大量建置、長期偵測。自 2020 年起,生多所已在全臺各地陸續架設超過 50 臺錄音機,至今已收錄將近 16 萬小時的錄音資料,為生物多樣性監測提供重要數據。
然而,緊接而來又是另一個挑戰:由於聽聲音辨識物種,需要高度專業的知識技能,面對這數萬小時的錄音資料,要如何快速有效地將其中的生物訊息擷取出來,已經超過人工可以處理的程度。
1 小時錄音檔只要 1 分鐘完成分析,SILIC 如何實現物種辨識?
為了解決這個「聽聲辨種」的難題,生多所從 Macaulay Library、xeno-canto 這兩個全球知名的鳥類鳴聲資料庫,以及其他動物聲音資料庫中,取得了約 2,500 筆錄音資料,花費大量時間將錄音資料中的動物聲音逐一標記後,經過 2 年的反覆的訓練、調整、擴增和強化,成功研發了「生物音智慧辨識與標記系統」,在 2022 年正式開放給大眾免費使用。
吳世鴻副研究員指出,SILIC 是將動物聲音訊號轉化為頻譜圖圖像,藉由不同聲音在圖像中會呈現出不同特徵的特性,再利用卷積神經網路(Convolutional Neural Network,簡稱 CNN)等常用於辨識圖片、自然語音的深度學習模型,訓練 AI 從頻譜圖進行物種辨識。據了解,每 1 小時的錄音資料,SILIC 平均只要 1 分鐘就能辨識完成,準確率達 95%,速度之快是人力完全無法比擬的。
不同鳥類的鳴叫聲有不同特性,將其轉換成頻譜圖圖像後,可以圖像方式讓 AI 進行學習與辨識。圖片來源:農業部生物多樣性研究所提供
事實上,SILIC 系統並非全球唯一的野生動物聲音辨識 AI 軟體。吳世鴻副研究員指出,在開發 SILIC 初期,國際上也有許多團隊在積極開發類似的鳥音辨識工具,開發過程中就陸續有數篇研究發表,不過這也讓團隊隨之調整開發模型,最後危機成為轉機,得以用更新穎的技術發展出 SILIC。
相較於其他 AI 軟體僅能判斷音檔中是否存在特定物種,吳世鴻副研究員表示,SILIC 能精確定位每一筆聲音的時間點和頻率範圍,可以精確估算鳴叫次數和音量,這是其他 AI 軟體難以做到的。此外,訓練 SILIC 所需的資料量僅為其他 AI 軟體的十分之一,平均只要不到 10 筆資料就能訓練 AI 辨識出一種聲音,而且對複雜的聲景、微弱的聲音都有很好的偵測效果。
即便叫聲重疊,SILIC 依舊能精準辨識不同鳥類鳴叫聲。圖片來源:農業部生物多樣性研究所提供
目前,SILIC 可以辨識 159 種鳥類、32 種蛙類、10 種哺乳類及 1 種爬蟲類,在可聽音的部分已有階段成果。不過,臺灣鳥類超過 600 種,吳世鴻副研究員指出,除了將持續增加物種數及提高準確率外,也規劃開發專門用於蝙蝠超音波回聲定位音的 SILIC-BAT,目標是要辨識臺灣所有的陸域脊椎動物,期盼能協助推動臺灣的生物多樣性保育。
SILIC 是完全免費的工具,民眾可以將自己錄下的錄音資料上傳到平臺,系統就可以讀出是哪一種生物、在哪一段時間發出聲音、發出幾次聲音。同時,平臺也開放 GitHub 原始程式碼,免費提供民間單位開發相關物種聲音辨識 APP 等軟體。
吳世鴻副研究員補充,SILIC 的名稱由來是為了向臺灣原住民致敬。泰雅族有鳥占傳統,族人會觀察 siliq(繡眼畫眉)的聲音和行為,來決定是否進行一些重要的活動,例如祭典婚儀、狩獵、出草,或是耕種等,展現出原住民與大自然間的互動是審慎而敬畏的。吳世鴻副研究員強調,「團隊也對 SILIC 有同樣的期許,希望 SILIC 可以協助人們解讀鳥音,讓我們能更有智慧的理解大自然捎給我們的訊息,讓我們的一舉一動都能和大自然和諧共存。」
「生物音智慧辨識與標記系統」計畫成員,由右至左為生多楊嘉棟所長、吳世鴻副研究員、生態系經營組林瑞興組長。圖片來源:農業部生物多樣性研究所提供
本著作係採用 創用 CC 姓名標示─非商業性─禁止改作 3.0 台灣 授權條款 授權.
本授權條款允許使用者重製、散布、傳輸著作,但不得為商業目的之使用,亦不得修改該著作。 使用時必須按照著作人指定的方式表彰其姓名。
閱讀授權標章或
授權條款法律文字。