<
循著科技發展的趨勢,自動化無人移動工具的應用已指日可待。然而應用時要確保人身的安全,「影像判別」的準確性至為重要。雖然目前因AI與機器深度學習(deep learning)的快速發展,機器已有基本的能力可以準確判定影像中的人、物件等,但環境的干擾仍嚴重影響了判讀的準確性,這也是亟待解決的重點。
元智大學資工系的陳柏豪教授研究「移動物體偵測」已有多年,對這方面的問題頗有心得。他表示,當前影像判別的技術就某個程度而言其實可稱已成熟;例如在良好的天候下,判別的準確率幾乎能達到95~98%,但天氣不好,例如雨天時,準確度便大打折扣,這嚴重影響了使用者的信心。
晴天和雨天影像的最大差異來自雨痕的干擾,針對這個問題,移除雨痕並重建清晰的影像成為科學家努力的目標。一般而言,影像處理可分為動態(影片)與靜態(圖片)兩大類,在重建影像的方法上各有不同。陳教授表示,影片由於有「時間軸」特徵,可藉由分析、比較前後連續時間點上的影像差異,估算雨痕的存在,然後抹除雨痕重建出沒有雨痕的影像。這方面的演算技術發展較早,已有些許的成果。
至於靜態影像的重建技術,發展上就艱困許多。由於少了時間軸的參考,影像無可相互比對,若只憑單張影像就要抹除某些元素,便得倚靠強大的演算法。大致上,這方面技術的概念是先把雨天的影像拆解成可呈現物體本身特徵的低頻影像,與表現物件質感、紋路的高頻影像兩類,而雨痕通常是藏身在後者的影像中。接下來便是設法把代表雨痕的元素濾除,就可重建沒有雨痕的影像。
這個方法雖然可行,但成果的進步空間仍很大。主要關鍵在判定雨痕的方法,這方面百家爭鳴,效果各有千秋,但誤判的情況時有所聞,一直無法順利建得清晰的影像。
陳教授的研究方法打破過往以重建「全面清晰影像」為目標的思維,容許模糊存在,並以之發展出一套新的演算方法來重建影像。在流程上,這個方法包含稀疏影像重建與錯誤最佳化兩個大階段。前者是先把影像中的各個部分拆解成由各種元素圖形(atom)依不同比例所組成;而後者是結合特殊的演算法以及一種富有彈性的評估錯誤機制,去審視重建的結果。
陳教授指出,這套富有彈性的演算評估方法最關鍵的貢獻,是可以針對影像中與雨痕較無關係的部分進行較嚴格的演算評估;另一方面,與雨痕緊密混雜的位置則給予較寬鬆的評估門檻。經由這方法重建的影像,雖然仍無法完全去除雨痕,但對於影像中重要的部分,反而能保留其細節與特徵,達到精準判別的原始需求。
陳教授另闢蹊徑的新演算法雖然不能得到全面清晰的影像,但是對於影像判別已能提供突破性的實質幫助。此外,這個方法雖然是針對單張影像發展而來,但也能應用於影片類型的影像,深具發展的潛力,對未來智慧交通、公共影像監控,甚至是智慧型手機程式開發等各種應用層面,是個令人欣喜的好消息。