萌寵影片療癒人心
不管你是貓派還是狗派,每天閒暇之餘只要刷刷網路上毛孩們的日常生活,一整天的疲憊就消失了,連牠們打哈欠、伸懶腰的表情都不想錯過,恨不得把這些寵物的 24 小時全部存在手機裡。
但現代人工作繁忙,有時連好好陪毛孩的時間都沒有,記錄這些平凡日常的成本實在太高了,更何況拍完後還要整理、剪輯、調色!身為愛寵物如癡的家長們肯定也不想放過那些可愛的日常瞬間,要是能有一個機器隨時跟拍這些好動的孩子,該有多好?最好還能自動把影片剪輯好,只要負責欣賞就好了?
這麼好康的事情,在現實中是存在的喔!
寵物飼主不想錯過毛小孩每個可愛瞬間。圖片來源:Tanya Gorelova/pexels.com
神奇的寵物專屬攝影師
國立勤益科技大學電機工程系葉政育教授注意到主人們的心力交瘁,便開始思考如何讓我們更輕鬆地記錄寵物的日常。他的魔法就是「物件偵測」與「寵物動作辨識模型」兩大技術的利用。
就像是直接從厚厚的歷史典籍中標出精華的筆記一樣,這套系統開發出的 AI 技術具有自動辨別寵物特定圖像的能力,運作流程主要分為兩個階段。首先透過物件偵測,確認影片內容中是否有出現寵物的身影,接著在第二階段時利用動作辨識找出寵物的特定動作,並另外進行保存,等於是自動協助飼主進行重點整理,大大減少了反覆整理素材和剪輯的時間,也降低寵物影片的製作門檻。
魔法的奧祕就在於卷積神經網路(convolutional neural network, CNN)模型,簡單來說,它就像我們大腦的額葉一樣,專門處理網路資料的視覺資料,只是他的視力比人類好非常多。在日常生活裡也隨處可見,像是修圖 App 偵測人臉、疫情時的口罩偵測,或是自動駕駛辨識路況的功能,都是從 CNN 誕生而來的,這項技術早已融入我們的生活。
在開發的過程中主要使用的是 YOLOv4 的動作辨識模型,當年 YOLOv4 的推行大大地增進了物件偵測的技術,這項造福人類的技術共有三位作者,分別是來自中央研究院資訊所的廖弘源所長、王建堯博士,以及來自俄羅斯的 Alexey Bochkovskiy,可以說是 AI 界的臺灣之光。葉政育教授利用 python 程式語言搭配多項資料庫進行 CNN 模型的開發,貓與狗的模型雖然結構相同,卻是各自獨立的訓練,光是貓貓吃飯的圖像資料就有 300 張,讓模型吃下各式各樣貓貓狗狗的圖像數據,訓練動作辨識的靈敏度。
那麼最後又如何判斷辨識率的精準程度?訓練完成時會產出混淆矩陣的表格,這就像是幫機器打分數一樣,透過判斷各個格子的數字與位置,就可以確認結果。這套模型在貓與狗的圖像辨識上正確率全部超過 95% 以上,代表了系統開發的可行性,技術前景可期!
重點是,因為運用的模型尺寸很小,僅有 2.8 MB,執行速度卻非常快,相當具有開發價值、實用性高。這樣一來飼主就能夠更有效地進行影片紀錄以及後續剪輯,溫存與毛小孩相伴的點點滴滴,還有更多的時間陪伴牠們。
YOLOv4(ours) 以穩定的表現脫穎而出,特別是在高 FPS(frame per second,每秒顯示影格數)區域,保持了較高的 AP(average precision,單一類型影像平均準確率),適合需要「即時運行」的應用場景。
圖片來源:Bochkovskiy, A., Wang, C.Y., Liao, H.Y.: ‘YOLOv4: Optimal Speed and Accuracy of Object Detection’, arXiv: 2004.10934, 2020.
寵物經濟鏈成為主流
寵物影片創造的影響力可不僅限於撫慰人心。除了展示更多照護、互動的相關知識外,也藉由自身的指標性與話題度引領公眾關注動物權的問題,加深人跟動物之間的連結,牠們不只是網路寵兒,更是一個個的「品牌」,除了娛樂價值也帶來很高的商業價值。
你一定看過那張雙手交叉、眼白還微微露出來的得意柴犬臉,但你肯定沒想到,這個迷因現在竟然成為全球市值前十大的虛擬貨幣!2013 年時兩位美國工程師推出以柴犬迷因 Doge 為原型的狗狗幣,原先只是個測試工具,卻受到馬斯克公開支持,用途廣大,連特斯拉的部分產品都可以用狗狗幣進行支付。美國知名雜誌選為當年最具影響力寵物虎斑暹羅貓 Nala ,坐擁 IG 四百五十萬粉絲,呆萌搞怪的表情收穫許多粉絲的心,許多相關的書籍創作、商品代言蜂擁而至,更進一步推出自有的貓食品牌,身價高達 29 億新台幣。可以說從影像發起的寵物 IP 已經勢不可擋之勢進攻全球各大市場。
臺灣當然也不例外,柚子、Nana、豆漿都是從社群軟體中脫穎而出的寵物網紅們。知名 YouTuber 好味小姐與她的貓咪們共同創立出良好的主寵形象,打著「養隻貓、做頓飯,一起過日子」建立起自有的商業品牌,推廣健康又好吃的貓食;而臺灣第一位成為百萬 YouTuber 的黃阿瑪更發展出許多周邊產業,官方網站上的產品從居家生活到手機周邊種類繁多,收穫臺灣大小民眾的喜愛。
其實許多的迷因跟短片,大多是主人不小心捕捉到的意外瞬間,卻帶動意料之外的話題,在這項寵物影片剪輯的科技普及以後,相信這條產業鏈正走向一條嶄新的道路,讓我們能夠看見各式各樣的寵物風貌。
用科技與寵物並行
新穎的技術具有高彈性可以持續發展,未來不僅可以應用於家庭的寵物影像紀錄,整合寵物健康科技更能夠搶攻全球超過 2,000 億美元寵物照護市場商機。今年初於美國拉斯維加斯舉辦的年度消費性電子大展(Consumer Electronics Show, CES)便以工研院為代表,展示毛孩相機的相關技術,吸引世界知名廠商前來了解。
另外,擴展不同生物的模型與資料後,還有助於各類生物的行為觀察,深入探索動物的行為模式、情緒與生理反應等。若是結合生態保育、動物心理等跨領域的應用,我們將有機會用更加科學化的方式跟自己的毛小孩交心,生物學家也能精確地掌握動物與環境之間的連結與發展。科技令我們以另一個視角看待世界,重新思考人類與動物之間的關係,促進生物之間的平等與連結。
本著作係採用 創用 CC 姓名標示─非商業性─禁止改作 3.0 台灣 授權條款 授權.
本授權條款允許使用者重製、散布、傳輸著作,但不得為商業目的之使用,亦不得修改該著作。 使用時必須按照著作人指定的方式表彰其姓名。
閱讀授權標章或
授權條款法律文字。