台灣人愛看病,平均一年看診15次,相較於美國只有4次;台灣人逛醫院就像逛街般,身體一有症狀往往跳過家醫科直接掛專科。這樣的做法就像是定時給醫生看看身體有什麼問題,而這樣的登入式就醫習慣,兩千三百萬人的台灣一年就會產生三億多次的就醫紀錄,於是成就了一個龐大的健保資料庫。
藉由台灣健保資料庫做出的論文每年高達七、八百篇,許多研究者常試圖從兩種看似無關的疾病中尋找其關聯性,像睡眠中止與陽痿的關聯,或二尖瓣閉鎖不全與恐慌症的關聯等。這樣的研究或許有其意義,但引致國際學界詬病台灣的研究者多用同一種方式進行研究。
為了能一口氣把所有疾病的關聯性都找出來,臺北醫學大學醫學科技學院院長同時身兼萬芳醫院皮膚科主任及臺灣人工智慧醫療研究中心(AIMHI.tw) 發起人的李友專教授和國際上一些研究者合作,從疾病的全表現體(phenome-wide)以兩萬種國際疾病分類碼(ICD-9-CM)為基礎,把台灣健保資料庫常見到的一萬種疾病進行關聯性組合,建立了疾病關聯資料庫(Phenome-wide associations study,簡稱為PWAS,網址:http://pwas.tmu.edu.tw),期能協助研究者更有效地利用現有資料,以發展出更進一步的研究成果。
「我們把台灣健保資料庫中常見的1萬種疾病相互加乘計算得出了1億種組合,再把這一億種組合分為10組年齡層和男女兩種性別,於是得到20億種組合。把這些組合放入資料庫中,研究人員就可以從中算出疾病間的關聯性。例如鍵入高血壓的疾病代號與現年40~49歲的女性兩個條件,就可以得出在這條件下,腦血管栓塞與糖尿病、視網膜病變等疾病的關聯度(odds ratio)極高。同樣地,鍵入高血壓、現年40~49歲、男性等條件,則會發現其容易與腦血管栓塞、顱內出血等疾病相關,且關聯度相較於高血壓的女性有相當的差異。」李教授說。
但由於PWAS資料庫中所顯示的數值過於瑣碎、不易理解,李教授的團隊另發展出一套疾病地圖(disease-map,網址:http://disease-map.net)。他說:「其實這就是疾病宇宙的概念,我們以每一個球體來表示一個疾病,球與球之間的距離遠近代表疾病關聯度的高低、球的體積大小代表疾病的常見度,而顏色則代表疾病的系統。從這樣的資料庫就可以很容易找出常見且可能相關的疾病,例如高血壓和糖尿病、敗血症、身體撞傷等的關聯,研究者也可以從中找到許多研究的契機與線索。」
雖然PWAS資料庫是以台灣健保資料庫為基礎,但仍適用於國外的研究,因為即使疾病的流行率可能不一樣,但疾病間的關聯性卻是一致的。「也就是說,比較台灣與國外的疾病地圖,球的體積大小可能不同,但球體間的距離應該是一樣的。」李教授說。
李教授團隊所建構的PWAS資料庫可謂全球創舉,未來還可能與工研院合作進行資料松(datathon)的研究,希望把資料開放出來,讓相關領域的研究者能從中發現更有趣的現象及關聯性。另外,李教授也希望未來在共病研究中深入應用PWAS資料。
「過去因為醫療不發達,人可能只因一個疾病就告終了。但隨著醫藥進步,人的壽命愈來愈長,可能會與一種以上的疾病共存一段時間,因此,了解這些疾病如何糾纏在一起,或了解如何才能解開這些疾病間的糾纏,都是未來醫學研究的重要方向。」李教授說,PWAS資料庫可謂是共病研究的一個起點,而在台灣健保資料庫可提供龐大與詳盡的數字優勢下,未來可能引領許多新的研究方向,甚或解決台灣醫療制度面臨的瓶頸。