跳到主要內容

科技大觀園商標

分類項目
Menu

大資料視覺化分析淺談

102/05/02 瀏覽次數 12925
現在科技的進步,可以測量及取得資料也越多,資料的精度也越來越高。收集到的資訊量也呈現爆炸性的成長。資訊累積的速度已超過軟硬體發展的速度。傳統的分析方式已經很難應付現在的巨量資料。

視覺化分析技術,就是將資訊以不同型式的圖表或圖形顯示,透過人眼接收,靠著人類大腦強大的綜合與辨異能力,找出隱藏的未知訊息,從中發現有用的資訊。所分析的資料,有別於以往傳統的科學資料(斷層掃描、計算模擬結果等)。對象包含統計資料、事件紀錄等各式分散雜亂的資料;如臉書朋友網路、網路連結(生物神經網路、網際網路、交通網路)、文字紀錄(關鍵字)、自然人文統計資訊等。每筆紀錄,可能只有局部關聯的小量資訊,但擴大到整體,要如何從百千萬筆資訊找出關聯性,是目前的一大挑戰。

2012年三月美國白宮提出的「推動大資料研發」(Big Data Initiative)1,就是針對現在的極大量資料,需要開發新的儲存、管理、分析等技術。而大資料的視覺化分析(Visual Analytics),是美國能源部、NIH、及NSF三個單位的發展重點之一。

視覺化分析的方式有許多種,我們可以用點線連結表現單筆關聯資訊,再集合所有紀錄,可以產生一個複雜的圖(Graph),但如何從含大量資訊的圖裡找點和點間的關聯性,又更是一個大挑戰。群聚分析(Clustering Analysis)就是可以找出網路結構裡的主群聚的方法之一;同群聚內的兩點的連結會比不同群聚間的兩點的連結強。將大量的資訊以Graph關聯表示,調整不同的位置、大小、顏色、形狀等來表示邊及點,來顯示群聚資訊,再從顯示的結果中找出視覺特徵,可以加速分析。分析的結果,如網路流量分析,可以用來規劃未來網路設備升級的優先順序。

大資料分析的視覺化分析是一門新興的領域,許多新的技術一直被開發出來,也應用在新的領域。在現在資訊爆炸的時代,會是一個協助分析與決策的好工具。

參考文件
  1. 白宮科學與技術政策聲明:http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_press_release_final_2.pdf
OPEN
回頂部