自然與社會的交集–統計學的歷史
92/07/11
瀏覽次數
3361
王秀雲|
高雄醫學大學性別研究所助理教授
在我們的生活裡,充斥著各種數字與它們所代表的事實,例如世界上每分鐘有若干個嬰兒出生、若干個人死亡,以及每天有多少人被診斷患有癌症等等。現代人了解社會現象及自己的生活,最常見也最有說服力的方式,往往就是使用統計數字。
最近SARS流行,據說有5%或15%的死亡率,雖然低於歷史上許多令人膽寒的傳染病(黃熱病是50%,天花是30%),但是媒體對死亡病例的大量報導,還是令人擔憂。臺灣是否能從世界衛生組織的疫區黑名單上除名,端看未來病例數目的增加是否能夠減緩甚至穩定下來。
我們也常常聽到,媒體根據統計結果報導臺灣的十大死因為何,或是男女平均壽命多長等等。在二十世紀初的中國,所謂四萬萬人口也常被用來表示中國社會問題的嚴重性(例如,二萬萬婦女同胞在黑暗中沈淪),或是中國潛在而龐大的力量。總之,這些統計數字常常被視為客觀又正確的,可以反映某些社會現實。
然而,這並不是古往今來一成不變的觀點。事實上,對於統計數字的迷戀,是過去三百年逐漸培養出來的。而這段歷史,與十七、十八世紀發生在歐洲的科學革命所建立的世界觀,有密切的關係。在這個包含許多思想轉變的世界觀中,實證態度與對自然法則的信仰,對統計學的發展特別有影響。
自十八世紀以來,許多社會思想家認為人類事務(包括人類身高分布、聰明與愚笨比率、犯罪機率、死亡人數統計、自殺率等等)基本上與自然界的現象一樣,有一定的規律並遵守自然法則(laws of nature)。例如,某個社會(如法國)某段時期裡(如1880~1900),死亡率或是犯罪率基本上有一定的規則,就像是該地區每年的降雨量一樣。根據這樣的理解,不但現有的社會現象有規律可循,人們也可以由此預測未來的社會現象。假設二○○二年臺灣地區因交通事故而死亡的人數為A,那麼我們可以說二○○三年的數字大概也接近A。
簡而言之,十八世紀以來的社會科學,重點之一是將機率(或然率)的概念運用到人類事務上,並將其精緻化。同時,許多社會學家也進行各種數字的蒐集,如死亡人數、出生人數、人口統計等等,其中最重要的概念是所謂的「平均人」或一般人。
我們在日常生活中常說「平均來講」(或是大致上來講),英文裡是average man,「平均人」,也就是一般人。「平均人」的概念起源自凱特列特(Adolphe Qutelet, 1796-1874),凱氏是比利時天文學者與數學家,自一八二○年代以來就長期蒐集各種數據,後人尊為統計學的創始者。
凱氏於一八四四年發表了一份研究,探討一八一七年所收集的五千位蘇格蘭軍人胸圍的測量紀錄。從這個分析,凱氏推論每個民族的人,身體各個部位的測量項(胸圍、頭圍、身高、體重等等),都有一個特定的平均值(學生體檢的由來顯然與此有關)。大多數的人,也就是一般人,都在這個平均值的範圍之內,僅有少數在此之外,凱氏稱這些少數例外為誤差法則(Law of Error),這些誤差就好像是上帝不小心所犯的錯誤。
另外一個說明方式是說,這些數值永遠呈現鐘型的分布(bell curve)。舉天文學的觀察為例。天文學家如果重複某個天文觀察多次,每次的數據會因儀器的位置有所改善、氣溫的不同或是天氣的變化而不同,但是這些數據會逐漸形成一個模式,類似鐘形分布圖,而大多數的數據都集中在中間的位置。
可想而知,這種社會統計學與其所蒐集的數據,為當時歐洲正在興起的民族國家提供了建構工具,許多國家的政策與稅收可以因此而有所依據。(按,歷史上另外一個喜好蒐集數據的政治體制是殖民主義國家,例如日據時代日本政府在臺灣所作的各種調查與統計。)
進入二十世紀之後,統計學的應用更是廣泛。上述「平均人」可以作為產品市場調查的依據:一般人的身高平均可以決定機車的規格、衣服的大小、門的尺寸等等,而有了對於大多數人喜好的理解之後,廣告公司也可以依此製作廣告短片或教條。例如,大部分美國年輕人認為自己是很特殊的個人,所以許多產品往往標榜個人獨特的品味。但是如此塑造產品形象有其基本的矛盾:如果該產品因此而廣受歡迎,它的消費者就很難維持他們的個人式獨特品味。最後,公共政策與公共建設也無一不是參考統計數據。
但是統計數字真的如此客觀與真實嗎?從什麼角度我們可以接受這個數學式的世界觀呢?如上述,運用在社會事務的統計是基於一個科學革命以來的假設:人類社會與自然世界所遵循的法則是一樣的。以此論之,如果從巨觀的統計觀點來看,某些現象的發生,基本上是自然法則的反應,因而暗示了扭轉自然的不可行性。也就是說,假設每年平均的謀殺案為B件,那麼來年的謀殺案數字還將是B(或至少相去不遠)。這樣說來,反正都是會發生的,如何防範謀殺案件?甚至減少謀殺案件?
這種態度也反映了人類理解到,自己對於所處世界(或是社會)的事務沒有左右的能力,這些事務隱隱之中好像是受控於一個超乎人類能力之外的力量。宗教人士會說是神的力量,而科學家會說是自然的力量。保守人士如果要阻止任何的改革計畫,這種概念大概可以派上用場。幸好今天很少人會因此而放棄防範犯罪。
其次,這種統計學鳥瞰式的觀點,其實很難應用到個別的人類身上。雖然統計學家說一個人每天出門之後被車撞到的機率為C,對於張三與李四而言,意義並不大,因為他們個別的生活狀況有所差異,所以整體機率與個人的關聯基本上還是很難建立的。我們常看到電視上說,世界上每分鐘有多少人被殺,但是這並不表示每個人都有相同的被殺機率。
最後,產生統計數字的方法往往與產生什麼統計數字有關。也就是說,如果不知道某個數字的產生過程或是為何而產生,我們就幾乎無法解讀該統計的意義。因此統計數字的公布如果沒有附帶的詳細說明,就有操弄大眾的嫌疑。例如,某個疾病的死亡率,如果沒有說明該死亡率的估計是否考慮到醫療照顧的有無,那麼我們就無法了解該疾病的威脅程度。
總之,對於統計數字我們不可不謹慎待之。