跳到主要內容

科技大觀園商標

分類項目
Menu

威爾考森的無參數統計

102/10/14 瀏覽次數 9953
1924年,法蘭克‧威爾考森(Frank Wilcoxon)自康乃爾大學獲得物理化學博士後,一直從事化學和殺蟲劑的研究工作,後來進入美國氰胺公司。威爾考森使用學生氏t-檢定和費雪的變異數分析方法,檢定比較不同處方之間的效用差異。在當時,像這樣分析實驗資料的方式可說是一套標準的流程,但是這些方法卻不怎麼適用於威爾考森在實驗中所得到的資料。

威爾考森試著做一連串的實驗,而這些實驗對他而言,不同處方之間的效用都有非常明顯的差異。但是學生氏t-檢定所得到的結果卻有時候顯著,有時候反而不顯著。尤其是在進行一連串化學實驗時,若化學反應爐一開始沒有充分地加熱,就會常常發生這種現象。或者是有特定的催化劑正好要改變性質進行化學反應時,也會偶爾發生類似現象。像這些會推得錯誤結論的實驗數據中,通常是有某一個數值不是太大就是太小。實驗結論的異常有時候可以歸咎於這個奇怪的數值,有時候卻找不到任何明顯的原因可以解釋。

威爾考森重新檢視了學生氏t-檢定和變異數分析的公式,並且了解到這個異常極端的數值會嚴重地影響到檢定結果。他直覺地想到把這些離群值移除,並把剩餘的資料重新套用學生氏t-檢定。但是對於一位化學家而言,後續問題接踵而來。哪些是離群值?要移除掉多少個離群值?離群值剔除後,學生氏t-檢定的機率表格還能適用嗎?

威爾考森翻遍文獻,想確定以前是否有數學大師推導出統計方法解決這些問題,卻找不到任何一篇相關的論文。威爾考森後來想了一個方法解決,就是根本不使用原本的統計公式,而是把觀察的資料用排列組合及排序的方式進行比較,並且使用繁冗的計算過程。

威爾考森心裡想這是多麼笨的一個方法,只有像我一樣的化學家才會研究這種原理簡單但是繁冗的計算公式。在統計界中一定早有某人做過類似的工作!但是他翻遍統計文獻,還是找不到類似的論文。他為了確認僅靠他自己所學的數學而推得的方法可行,於是把研究結果投稿至Biometrics期刊。縱使已經投稿了,他還是認為這不可能是他自己原創的方法,認定期刊的審查委員一定知道有類似的結果早已發表而會退回他的論文。一旦拒絕了,審查委員就會告知有哪些文獻可以參考。

但是,就連審查委員和期刊總編也不知道有類似的統計方法。最後認定這是一個全新原創的統計方法,並在1945年的期刊上刊登這篇論文。因為他所提出的方法並不需要估算機率分布的參數值,所以威爾考森開創了一個全新的統計領域–無參數統計學。

威爾考森和前面介紹的畢理斯之間也有一個小故事。因為「機率單位分析」方法需要繁瑣地反覆計算和使用複雜的表進行內插,而當時電腦不發達,因此威爾考森和美國氰胺公司的同事用了簡單的圖解表示機率單位值。為了證明他們的圖解值是正確的,在論文的附錄附了畢理斯的「機率單位分析」方法的公式,並於1949年發表於《藥理與試驗療效期刊》(Journal of Pharmacology and Experimental Therapeutics)。

電腦發達後,「機率單位分析」方法也可用電腦程式計算,但這些電腦程式工程師和使用電腦計算的藥理與毒理學家都引用威爾考森的論文為原始出處,因此威爾考森這篇有關簡化「機率單位分析」的計算方法至今被SCI期刊引用了9,523次。這並不代表威爾考森對「機率單位分析」有重大的貢獻,反而代表「機率單位分析」是一個非常重要而有用的分析方法。
OPEN
回頂部