首頁 > 大數據專題(導言):我們真的認識 Big Data 的「科學」嗎?
:::

大數據專題(導言):我們真的認識 Big Data 的「科學」嗎?

究竟神奇的 Big Data要如何運作?和十多年前的 Data Mining(資料採礦)又有何異曲同工?除了資工之外,數學、統計等其他學門在資料科學中分別扮演什麼角色? 在股市、在民調、在醫療等形形色色的領域之中,是否已經是能夠被成熟運用的產品了呢?
 
 
 
關於 Big Data(大數據)能夠如何在網路世代改變人們的生活,只要上網搜尋即可查閱到國內外大量的文章。不過,究竟神奇的 Big Data 要如何運作?和十多年前的 Data Mining(資料採礦)又有何異曲同工?除了資工之外,數學、統計等其他學門在資料科學中分別扮演什麼角色?在股市、在民調、在醫療等形形色色的領域之中,是否已經是能夠被成熟運用的產品了呢?
 
本次大數據專題要揭開大數據科學的面紗,專訪五位精通於不同資料科學領域的專家,讓我們即使從外行麻瓜的角度,也能了解大數據背後能夠如何運作的科學原理。
 
在展開資料分析之前,「資料」真的能夠完整呈現「真實世界」的全貌嗎?我們想問的問題,都能從手上的資料中得到解答嗎?本專題專訪了社會企業DSP智庫驅動的知識長謝宗震,從統計人的角度,細細討論了在分析資料前應該如何「思考」資料,以及統計人面對大數據時代的非結構化資料,應如何迎接挑戰。
 
台大資工系的林守德副教授,則從機器學習的角度出發,從社群網站的個人化推薦、地圖 APP 提供的最佳路徑等案例分享,主張未來時代的機器人,將跳過「報表」階段,直接為人類做出最佳的決策。而人類不應為此恐慌,而是進化到下一階段、找出更多電腦所無法辦到的事情。
 
談到社群網站帶來的海量資料,不可忽略語意分析的關鍵地位。語意分析讓選前的民意調查能夠更廣泛的涵蓋到各種更「非正式」的網路意見,也不再侷限於以數字獨霸的數據資料,更深入拆解文字背後隱含的正面或負面情緒意涵,甚至能夠藉此更快掌握並預測事件的發生。創辦意藍科技的楊立偉董事長,深入介紹了語意分析的觀念、應用和挑戰。
 
大數據的本質在於資料,東吳大學的助理教授吳牧恩認為,從小資料到大資料,都是數學這個學門能夠積極介入、加以演算和預測的。電腦硬體的運算速度,必須加上演算法的加持,才能提升解題效率、降低運算的複雜度,尋求出最佳解。
 
最後,在分析結果的可靠問題上,是典通科技的總經理楊雅惠著墨最深的。為了優化分析模型,深入研究大眾在網路上發表意見的行為模式可以做出更好的判斷,讓「大」數據獲得精緻化的可能。而在醫療資料的分析上,她則認為除了常見的隱私問題之外,也存在著多元採集設備之間缺乏共同標準的挑戰。
 
數據和資料從古到今都是人類尋求解答的重要材料,而網路時代的資料來源變多也變雜,不論是語意分析、機器學習、演算法、統計建模,眾多方法都試圖解決更多過去人類仰賴臆測萊處理的問題。看完這五位不同背景和專長的專家分享了他們的見解後,對於所謂大數據的定義和視野,也隨之更為寬廣了。(本文由科技部補助「新媒體科普傳播實作計畫-智慧生活與前沿科技科普知識教育推廣」執行團隊撰稿)
 
責任編輯:鄭國威
審校:陳妤寧
推薦文章