首頁 > 海量資料專題報導:序言
:::

海量資料專題報導:序言

從科學到醫療保健、從銀行到網路,目前海量資料的影響力已深入各行各業。例如:2009年全球流感盛行前,Google工程師想到或許可利用民眾在網路上搜尋的關鍵詞及搜尋頻率,比疾病通報系統更快找出那些感染流感的人,以便即時掌握疫情資訊。由於Google每天有超過30億筆的搜尋,這些儲存起來的資訊就可成為測試、分析之用
 
 
 
每隔一段時間,媒體上就會出現新鮮的科技名詞,繼雲端科技之後,目前當紅的科技趨勢莫過於「海量資料」(big data)。隨著各種行動裝置普遍,世界上每分每秒所產生、傳輸、儲存的資訊已龐大到超乎想像:網路公司Google每天處理的資料量超過24petabyte(1 petabyte等於1,000 terabyte,1 terabyte 等於1,000 gigabytes),Facebook每小時就會上傳超過1千萬張新照片,使用者每天按的「讚」或留言超過30億次,YouTube每秒上傳的影片總長度超過1小時,Twitter每天訊息量也超過4億則。

過去這些資料或許就只是儲存在某處的資訊,但現在透過分析技術,這些資料有更多用途:它可用來追蹤使用者的喜好,比如:Google可知道你通常在哪裡上網、週末去哪裡玩;Facebook可知道你喜歡聽誰的歌。能掌握使用者的習慣就能投其所好,例如:提供交通及天氣資訊,把新歌、新書推薦給你。這樣從資訊的「量」到資訊的「質」,從靜態的儲存到動態的管理、分析,海量資料將影響我們如何看待資訊,幫助我們用新的方式來瞭解世界,並得到新觀點、新價值,進而可能改變原有體系的運作。

從科學到醫療保健、從銀行到網路,目前海量資料的影響力已深入各行各業。例如:2009年全球流感盛行前,Google工程師想到或許可利用民眾在網路上搜尋的關鍵詞及搜尋頻率,比疾病通報系統更快找出那些感染流感的人,以便即時掌握疫情資訊。由於Google每天有超過30億筆的搜尋,這些儲存起來的資訊就可成為測試、分析之用。Google發現某些搜尋字眼,與有流感相關症狀的病人就醫求診之比例,具有高度相關性,因而可預測在各地疫情流行的程度。傳統上衛生機關仰賴醫師在臨床上發現病例後即時通報,以便擬定因應策略、降低疫情影響;然而,即使醫療體系迅速通報,衛生機關所掌握的疫情資訊仍然比實際病毒蔓延速度慢了1至2個星期,因病人通常是在身體不舒服之後幾天才就醫,各地通報資料往往也需時間彙整,如此一來衛生機關可能無法在關鍵時刻獲得確實資訊並迅速回應。但這套預測系統經過測試,竟與實際病例的資料十分符合,這將可以幫助衛生機關幾近同步的掌握疫情。

海量資料具有幫助人類追求量化及理解世界的潛能,過去許多我們無法想像成為資訊的事物,或是無法檢測分析的事物,例如:橋樑的震動幅度、引擎的發熱程度,現在都可透過資料化,找出潛藏在資訊中的價值,幫助我們預測未來、避免風險及解決問題。然而,就像過去專制國家監控全民生活一般,在儲存資料成本下降、分析技術強大的未來,資料蒐集、儲存即使用的情況將會大增,這除了可能對網路時代的隱私進一步構成威脅外,濫用資訊、過份仰賴資訊,甚至扭曲資訊的意義,可能對個人自由形成壓迫,構成更大的危害。我們在迎接海量資料的光明面時必須警惕,如何利用海量資料而非被資料所利用。

海量資料專題報導(一) 什麼是海量資料
海量資料專題報導(二) 海量資料的應用與商機
海量資料專題報導(三) 海量資料與物聯網
海量資料專題報導(四) 海量資料也可以拆開算-Hadoop
海量資料專題報導(五)  資料不用存?-江河運算
海量資料專題報導(六) 海量資料之法律與隱私問題

(本文由科技部補助「新媒體科普傳播實作計畫─電機科技新知與社會風險之溝通」執行團隊撰稿/103年/07月)

責任編輯:黃承揚|英商牛津儀器海外行銷有限公司
推薦文章