統計–讓數字說話的科學:應用統計與生技產品
100/07/05
瀏覽次數
21370
劉仁沛|
臺灣大學統計教學中心
統計應用小傳
在19世紀末,英國政治家卡爾皮爾遜(Karl Pearson)藉由比較實際觀測值和理論期望值,首先發展出分布適合性度的統計方法。而在同一時期,達爾文的表弟高騰在研究子女和父母在智商、身高等數量性狀間的關係時,發展出迴歸分析。在21世紀,迴歸分析已成為經濟、管理、醫學、生態、環境、工程和品管上重要的研究工具。
在20世紀初,英國統計大師費雪在羅斯姆提得農業試驗場工作時,發展出田間試驗的各種不同設計,以及利用變方分析和變積分析法來處理數據。這些試驗設計和分析方法不但是統計理論與方法上的偉大成就,更對20世紀糧食的增產和農作物的改良有不可磨滅的貢獻。
在20世紀50年代,英國的希爾把費雪在農業上的隨機試驗設計應用在醫學與藥物評估上,發展出隨機雙盲臨床試驗的基礎,對人類健康福祉有重大的貢獻。另外,在美國國家衛生研究院任職的孔費爾德把統計方法應用在流行病學上,證明抽菸和肺癌間的因果關係。
自孟德爾研究豌豆的遺傳性狀和摩根研究果蠅遺傳特徵以來,統計一直是遺傳和育種上不可缺少的工具,並且發展出許多研究遺傳的統計方法。此外,生物統計在生態保育和環境保護的應用上也有重大的貢獻。
在20世紀,統計除了在農業、遺傳、生物和醫學方面有重大的貢獻外,對於工業產品的產量和品質的提升也有不可磨滅的成就。如在20世紀初筆名為學生氏的戈斯特從牛津大學畢業後,進入位於愛爾蘭都柏林市的吉尼斯釀造公司工作。他把統計方法應用於改善釀造的技術以提升啤酒的品質和產量,並獨立發展出目前在初等統計課必教的小樣本學生氏t-檢定法(Student t-test)。
另外在1940年左右,在美國氰胺公司任職的化學家威爾考特森在應用上述學生氏t-檢定法時發生困擾,當資料不符合常態分布或含有離群值時,對學生氏t-檢定法的結果影響甚大,而且和直覺判斷不合。為了解決這實際應用上的問題,他發展出第一個以排序資料的排列組合為基礎的Wilcoxon Rank Sum Test,而開創了統計學一個全新的領域—無母數統計學。
在應用費雪所發展的試驗設計於工業上時遇到一些困難,最重要的問題在試驗材料不足影響試驗因素甚大。因此美國威斯康辛大學統計系前系主任,也是費雪的女婿,博克斯教授和兩位杭特教授發展出一系列的不同部分複因子設計解決這些應用上的問題,也開拓了實驗設計的一個新領域。
雖然統計學的許多方法都是因實際應用的需要而發展出來的,但統計理論的研究卻是這些新統計方法的基石。
首先,費雪在1930年左右提出評估統計量的標準方法是一致性、不偏性和有效性,並發展出目前標準尋求最佳統計量的最大概似估算法。而卡爾皮爾森的兒子艾根皮爾森和波蘭統計學家傑瑞尼曼利用數學建立統計假設檢定(statistical hypothesis testing)的理論架構基礎:尼曼-皮爾遜定理,和定義目前在各領域都使用的P-value。此外,尼曼在1934年提出現在已普遍使用於所有統計分析的信賴區間(confidence interval)的觀念。
統計的各種理論和方法在經濟學及財務金融方面也有傑出的貢獻。例如於2006年11月16日去世的諾貝爾經濟獎得主—美國芝加哥大學的傅利曼教授,是20世紀傑出的計量經濟學者。
除了在貨幣理論、消費分析和總體或個體經濟學上有重大的貢獻外,傅利曼也是一位傑出的統計學者,曾受教於哥倫比亞大學的荷特林教授,並發展出處理兩個變因的無母數方法Friedman test。他的理論也發表在頂尖的統計期刊上,如Journal of the American Statistical Association與Annals of Mathematical Statistics。這兩期刊目前仍是國內統計學者認定的重要指標期刊。
美英各大學都了解統計是一門理論與應用並重的科學,因此在各大學除了設立統計系外,另紛紛設置統計實驗室,開創統計諮詢的先鋒。最有名的是美國愛荷華州立大學斯內德克教授所創立的統計實驗室,後來成為世界上重要的統計研究中心。而斯內德克教授的學生科克斯教授後來到北卡州立大學創立另一個統計系,也成為目前統計教學和研究的另一個重鎮。
除此之外,美國肯塔基大學統計系是在1976年由來自北卡州立大學的安德遜教授所創立的,這是一個具有優良統計研究與教學傳統的大學的畢業生開花結果的典型例子。
經過20世紀的努力,統計學已成為21世紀各領域,如生物、生命科學、農業、醫學、公共衛生、經濟、政治、管理、會計、財金、國企、社會、工程、電子、資訊和品管各方面,蒐集及分析資料和制定決策時必備的工具。許多統計的理論和方法也是從各領域的應用發展而來。因此,統計科學是一個重要的跨領域研究平臺,而且成為評估各項產品的重要工具。
由上面的統計應用小傳可知,許多統計的方法和理論都起源於要解決應用上的實際問題。因筆者在美國時曾在跨國性大藥廠從事藥物和生技產品研發工作,回國任教後,也在行政院衛生署藥品諮詢委員會和醫療器材諮詢委員會擔任委員,從事藥物和生技產品的評估、審查工作,深深了解統計在生技產品研發與評估上的重要性,也知道目前評估生技產品統計方法的缺點和不足,更清楚發展新的評估藥物的統計方法在生技產品研發上的重要性,因此就統計在藥物和生技產品的應用上簡介如下。
生技產品統計評估
臨床試驗設計與分析
英人希爾應用在醫學與藥物評估上的隨機雙盲臨床試驗,對人類健康福祉做出了重大貢獻,因為可以把偏差降至最低,所以臨床試驗所得結論較其他臨床研究方法更為客觀和嚴謹,成為臨床醫學最重要的方法學之一。而統計方法在臨床試驗的設計、執行、分析和結果的詮釋上,都扮演重要的角色。
在藥物研發與審核上,臨床試驗更扮演不可或缺的角色。藥物臨床研發分為3階段,第I期臨床試驗主要目的在評估藥物的安全性和估算最大耐受劑量。若第I期臨床試驗的資料顯示新藥在最大耐受劑量下安全性是可接受的,則可進入第II期臨床試驗。
第II期臨床試驗的主要目的,在證明新藥具有療效和估算最低有效劑量,由最低有效劑量和最大耐受劑量就可決定治療上新藥的劑量範圍。第II期臨床試驗的另一目的是探討劑量和療效間的關係。
第III期臨床試驗的主要目的,是以大型的臨床試驗確認第I期和第II期臨床試驗所得到的安全性與療效。
在完成3期的臨床試驗後,藥廠把這3期臨床試驗的資料和臨床前的結果,按各國衛生主管機構規定的格式和內容整理成冊送審。3期臨床試驗所需的平均時間約為6年,所收納的病人數目,因疾病的種類不同,可自數百人至數萬人不等。筆者在美國工作的80年代,一個新藥的紙本資料和報告,要用至少一個以上的貨櫃運送至美國食品藥物管理局審查。若臨床試驗結果顯示主要療效指標P-value大於0.05,這新藥核准上市的機會是微乎其微的。
藥物基因體學和微陣列技術是過去10年重要的基礎科學發展和科技突破,它們在疾病的診斷和治療上都可達到以分子目標進行個人化醫療處置的目的。因此在這領域未來的研究重點,將以發展利用分子層次的前瞻性臨床試驗設計和分析方法為主:
評估多標的微陣列為平臺的生物晶片診斷的統計方法—個人化醫療的先決條件是必須鑑別病人是否具有藥物治療的分子目標,因此微陣列基因晶片和蛋白晶片等診斷試劑必須有適當的品質,它們的準確性、精確性和再現性則是品質控管的重要目標。
前瞻性的目標臨床試驗—傳統的臨床試驗是以病人族群為推論目標,但目前因藥物基因體學和微陣列的發展,使疾病治療能以分子為目標進行個人化醫療處置。因此發展目標臨床試驗的設計和分析統計方法,是未來臨床試驗最重要的研究領域。另外,若具有分子目標的病人盛行率很低,目標臨床試驗因收納病人不易且可行性低,如何在族群和個人化之間取捨也是未來統計的挑戰。而生物晶片的臨床用途試驗、藥物臨床效用試驗、合併設計和分析的統計方法,也是將來發展重點。
學名藥對等性的評估
生物技術是我國在21世紀的關鍵技術,而生技製藥工業是低汙染、技術密集、高附加價值的工業,因此是我國在21世紀國家命脈所繫的重要工業。政府目前已投入大量資金和人力,全力發展生技製藥工業。
生技製藥工業和其他工業,如電子工業,有兩點基本上不同的地方。第一、藥品是病人服用後進入人體治療疾病,因此藥品必須根據各國嚴格的藥品法規範審核批准之後,始可經醫生處方後購買。第二、新藥研發後經10至15年的時間和平均8至10億美元的投資,但不一定會得到各國藥政主管機關的核准。因此生技製業雖有上述的優點,但也是需要大量長期投資和高風險的工業。
經過研發上市的藥物稱為原研發藥,為了鼓勵藥廠從事藥物研發和補償10至15年的時間與平均8至10億美元的投資,全世界各國都給予原研發藥20年的專利保護期。大部分仍在專利保護期的原研發藥非常昂貴,不是一般國民可負擔的。
但原研發藥的專利保護期到期後,所有藥廠都可製造和生產相同的原研發藥,這類藥物稱為學名藥(generic drug)。因學名藥不需Ⅰ、Ⅱ、Ⅲ期臨床試驗的長期投資,風險較低,而且我國國內藥物市場小,因此我國發展生技製藥時,若能以國外市場為主,並以發展不需Ⅰ、Ⅱ、Ⅲ期臨床試驗的學名藥為出發點,就可避免各期臨床試驗的巨額投資。
關於美國學名藥的核准,評估時所根據的法規是美國國會1984年所通過的Drug Price Competition and Patent Restoration Act (又稱Hatch-Waxman法案)。雖然學名藥不需經過Ⅰ、Ⅱ、Ⅲ期的人體臨床試驗證實療效和安全性,但根據這法案所訂的藥品法規,要求藥廠必須執行人體試驗,證明學名藥和原研發藥的療效和安全性具生物對等性。
新藥研發的目的在證明新藥的療效比安慰劑或目前市場核准藥物為佳,可使用傳統的假設檢定的方法,但學名藥的評估主要目的在證明其療效和安全性與原開發藥品對等,必須以對等性假說進行,因此又開拓了一個新的統計方法學領域。
美國曾在2001年1月公告評估藥劑生體對等性統計評估方法準則,並於2003年3月公告口服用藥藥劑生體可用率和對等性試驗一般考量基準。我國也有類似的基準,用來審核學名藥和原研發藥間的藥劑生體對等性。不論美國、我國或世界其他國家,都以對等性的統計概念評估學名藥是否和原研發藥具藥劑生體對等性。
自1999年至2008年,估計學名藥減少美國醫療支出高達7,340億美元,而且迄今美國75%的處方藥都是學名藥。我國衛生署健保局前總經理張鴻仁醫師也說明使用具相同療效/安全性的學名藥,每年可節省健保給付約40~50億臺幣。美國布希前總統在2002年10月21日(http://www.whitehouse.gov/news/ releases/2002/20021021-2.html)宣布,將儘量和儘快提供便宜但具有相同療效/安全性的學名藥給美國人民。
在未來5年,大約有200個原研發藥的專利到期,所有藥廠都可製造並提供便宜的學名藥。因學名藥不需長期研發,技術門檻較低,而且市場大,所以許多國家紛紛投入學名藥的市場。最成功的是以色列的Teva藥廠,它從80年代的5千萬美元的小藥廠,成長為目前年收入140億元美元的世界最大學名藥藥廠。在2009年一年中,美國就有6億3千萬處方藥是該藥廠的產品。其他成功的學名藥廠,包括印度Ranbaxy藥廠及Dr. Reddy’s藥廠。
我國很遺憾地未能搶得這一商機,迄今尚未有任何一個或一種藥物產品被美國食品藥物管理局核准,實屬遺憾,必須加倍努力,才能迎頭趕上。
疾病診斷工具的評估
這方面的研究主要在評估新的、非侵入性或較便宜診斷方法的診斷準確度,和標準的、侵入性或較貴診斷工具的診斷正確性相比,是否為不差或對等的統計方法。因為每位受試者都接受新的及標準診斷工具或藥品,所以資料型態是配對二元資料,在發展統計方法上有較大的挑戰性。
醫療診斷工具相關統計議題,尚包括靈敏度和特異性的評估、精確度及線性的評估,以及最低可測濃度的估算(奶品是否含有三聚氰胺,就是最低可測濃度估算的問題)。統計在藥物品管上也十分重要,如藥物有效期間的估算,溶離率和有效成分均一度的評估等。
除了在藥物或疾病診斷工具評估方面非常重要外,統計在基改作物的評估上也擔任不可或缺的角色。目前除歐盟外,基改作物和相關產品在各國上市前,並未以統計方法評估基改作物和傳統作物的特徵、性狀是否對等,因此被核准上市的有安全顧慮的基改作物對消費者的風險並未估算和量化,不被核准上市的無安全顧慮的基改作物對生產者的風險也未量化。
基改作物已在自然環境中長期栽種,基改作物的產品也已被人類長期使用或食用,但目前尚未發展出對環境和人類長期的效益與風險評估的統計方法。因基改作物是大面積的栽種,而又被人類整個族群食用,所以採用平均相等性方法評估基改作物和傳統作物的相似性並不恰當。因此建議採用容忍區間和族群對等性評估基改作物與傳統作物特徵性狀,用二個族群重疊的比率評估兩者間的相似性。在這方面,基改作物統計評估的統計方法學尚有很大的發展空間。
感想
統計在21世紀已成為評估各種產品不可或缺的工具。就藥物與生技產品領域而言,跨國性生技製藥公司把15~20%的利潤投資在產品研發上,許多跨國性大藥廠都僱用上達數百位具有統計博士學位的專家,從事新藥及生技產品的研發工作。美國食品藥物管理局也聘請150至200位具統計學位的專家,進行藥物和生技產品的審核工作。
美國一家跨國性藥廠所聘請具有統計博士學位的統計專家人數,幾乎和臺灣具有統計博士學位的人數相等或甚至還多。美國各大學每年所畢業的統計學博士,幾乎有一半進入生技相關產業,從事新藥研發或審查工作。這些在跨國性大藥廠工作的統計專家雖然沒有發表許多SCI期刊的論文,但是他們都是具有豐富生技製藥研發經驗的統計專家,這也是美國跨國性大藥廠的生技藥物產品在世界上維持領先的主要原因。
反觀我國迄今仍然沒有一個藥廠僱用具有博士學位的統計專家,幾乎所有具有統計博士學位的人才都在中央研究院或各大專院校做研究與教學工作。為了升等壓力,雖然有些學者的研究成果可刊登於高影響的SCI期刊上,並可榮獲國科會傑出獎,或榮聘為終身特聘教授。但在象牙塔內得到的研究成果,對我國生技製藥產業或任何產業的貢獻很有限,大學及研究機構的研究方向與主題和國家產業完全脫節,這是我國產業一直在代工層級而無法向上提升的一個主要原因。
另一個統計無法在我國產業界深耕的主要原因,與大學的統計教育有關。因為統計的重要性,現在國內大學各科系都把統計學及相關課程列為必修課程,如臺灣大學每學年修習統計課程的人數高達7,500人次,其中5,000人次修習初等統計學。一方面因有統計博士學位的教師不足,另一方面因具有統計博士學位的教師做高深的理論統計研究,無法或不願意教授初等統計學,導致教授初等統計學的教師大部分是不具統計博士學位的教師,容易造成教學品質低落和教學成效不彰。
難怪很多學生在修完統計學後都不喜歡統計,恨不得儘快地通通忘記;畢業後進入各產業就業擔任主管時,因為修習統計的夢魘,所以討厭統計進而不尊重統計,不用統計做產業提升。這可悲的現象,在大學從事統計教學的同仁要負起大部分的責任,如何進行大學統計教學和使統計研究與產業結合,是大學統計學教師目前最大的挑戰。讓我們共同努力,克服這一困難,並以統計提升我國的國力。