首頁 > 大資料帶起國際研網新世界
:::
大資料帶起國際研網新世界
當大資料的風拂過大地,在每個地方萌發一片新綠的同時,學術研究網路的世界也悄悄進行著翻天覆地的改變,以滿足雨後春筍般冒出的資料傳輸新需求。
 
 
 
當大資料的風拂過大地,在每個地方萌發一片新綠的同時,學術研究網路的世界也悄悄進行著翻天覆地的改變,以滿足雨後春筍般冒出的資料傳輸新需求。在學術世界嶄露頭角的新資料大戶都是響噹噹的角色,最具代表性的莫非橫跨瑞士、法國、意大利三國邊境,甫證明上帝粒子(Higgs Boson)存在並因此讓研究人員抱走諾貝爾獎的大型強子對撞機(Large Hadron Collider, LHC)。還有帶著人類永恆的好奇探索宇宙本初奧祕的電波天文望遠鏡群、追尋終極生命祕密的各種生物基因圖譜計畫、以及企圖了解大自然的力量的高解析度地質、氣候模擬等等。這些研究產生了龐大的數據資料,並非一時一地的設施或研究人員所能消化,因此隨即乘著學術研究網路流向世界各地摩拳擦掌的科學家,等著所蘊含的奧祕被解開。

正因為學術大資料源自於特定設施,資料獲取後需要迅速分配至眾多研究單位的特性,國際學術研究網路的頻寬,線路分佈及所運用的技術近年來逐漸向與商業網路迥異的方向演化。尤其是頻寬的大幅擴展及線路分佈向大資料研究據點的高度集中。各國國內學術研究網路骨幹自從2011年起紛紛向100 G升級的這股風潮,也開始吹向了各國的國際線路。如今美歐間的國際頻寬已在數年間從60 G大幅升級至260 G。藉由美國國家科學基金會(National Science Foudation, NSF)的推動,美、亞間的線路亦即將自目前的10 G規模升為100 G。美、澳間亦迅速從目前的20 G向200 G蛻變。而這100 G的頻寬資源也不再像過去僅止於骨幹的核心段落,而是直接連達各主要的國家實驗室和研究設施。

位於阿姆斯特丹的歐洲主要學術研究網路交換中心NeitherLight光是直接跨國連向LHC一地的頻寬就高達320 G之譜,遠超過連往任一歐洲國家學研網的規模。美國首屈一指、肩負科學計算重任的超級電腦中心NCSA更有總計400 G以上的學術研究網路頻寬在背後支持。此外美國最重要的國家實驗室,例如Argonne National Laboratory、Brookhaven National Laboratory、Oak Ridge National Laboratory等數十間位於尖端研究頂峰的聖殿,都有100 G等級的學術研究網路直接服務。學術研究網路成為大資料科學研究的重要後盾,已是當今國際學術研究網發展的重要趨勢。

以LHC為例,其所產生的巨量資料經由國際學術研究網路流向全球各地研究機構,總頻寬即穩定保持在接近150 Gbps的龐大規模。其中台灣亦有參與的緊湊緲子螺管探測器(CMS)及超導環場探測器(ATLAS)實驗即佔流量當中最大的比例。

我國學術研究單位近年來逐步擴大國際大資料相關科學研究的合作參與。以年度雙向傳輸總量為例,交通大學、中央大學、清華大學、中山大學及台灣大學在2014年的傳輸量分別比前一年成長19.3%、64.8%、12.7%、59.3%及3,475.7%。分析傳輸的目的地之後更可發現,這些新增的資料傳輸量均來自電波天文學、高能物理等美國頂尖合作單位。若以傳輸的型態加以分析,更可發現在此類大型傳輸發生時,往往單次傳輸就造成與目標美國交換中心間的國際線路呈現完全滿載的情況長達1 ~ 2週以上。由於學術研究網路較一般商業網路更加強調服務大資料傳輸研究的峰值傳輸能力,目前的國際線路現況顯示目前國內學術單位對於國際頻寬的需求已遠非現有的容量可以提供。

由於大資料相關研究的快速進展,研究者可從相同的原始資料中分析提取產生遠多於原始資料的加值資料。在頻寬擴充之前,國內學術研究單位可能僅能下載單一資料組(Dataset) 進行研究。在國際頻寬擴充後,在相同傳輸時間下,即可與國外合作單位排程下載及交換多組原始及加值資料,相互比較及分析,大幅增加資料相關研究所能含蓋的層次及範圍。因此國際線路容量的擴充,雖對常態性一般用戶的頻寬使用量提升有限,卻可大幅提升大資料用戶的使用便利性。因此拓寬我國的國際學術研究網路頻寬將成為未來TWAREN努力的重點目標之一,以期帶給國內學界更便捷寬廣的國際傳輸品質,促進更多的科學發現及發展。
推薦文章

TOP