什麼是統計|最新文章

facebook twitter line 中列印書籤

什麼是統計

95/01/05 11715

鄭惟厚｜淡江大學數學系

假設我們想做個手機大評比，這一個問題乍聽之下好像沒什麼，不過讓我們稍微探討看看，或許你等會兒會有不同的看法。關於手機，我們想知道的事情可能包括：哪個品牌手機的功能最齊全、最符合我們的需要，哪家的接通率最高、通訊的品質最佳，以及哪家的收費較優惠等等。在這些項目中，有的只要我們能夠蒐集足夠的資訊，就可以大致地判斷，比如說手機功能。但有的項目恐怕就不是那麼簡單而且具體，比如說通訊品質。假設我們想比較通訊品質，應該怎麼考慮這樣一個問題呢？

首先，應該先把問題定義清楚。通訊品質和基地台的設置有關，但是和手機有沒有關係呢？好像也有。那我們就要先弄清楚，是要比較電信業者的通訊品質，還是不同款手機的通訊品質呢？假設我們決定比較電信業者的通訊品質，再來還有問題要問，「通訊品質」的概念頗抽象的，要怎麼比呢？當然我們可以叫大家來打分數。

只是每個人的標準可能差別很大，這樣的比較方法對業者會不會不公平？應該很有可能。既然打分數會標準不一、差距太大，或者可以考慮只做大致歸類。比如說，我們只問消費者對通訊品質是否滿意，然後拿問到的結果當作評比的標準，這樣似乎是比較合適的做法。假設就這麼決定了，我們問一些人對通訊品質是否滿意，然後算出每家電信業者的滿意百分比，再比較誰的百分比最高。

一家業者的通訊品質滿意度，照理應當是這家業者所有客戶中，對品質滿意者所占的百分比。可是這個數字我們永遠沒法子知道，因為我們不可能問得到每一個人的意見，所以只能想辦法估計它。雖然問不到所有人的意見，但一定可以訪問到一部分的人，所以我們不妨問問一些人的意見，算出對各家業者滿意的百分比，然後把這些百分比當做所有客戶滿意百分比的一個估計，這似乎是很自然、直觀的一種估計方式。問題是，我們應該問誰的意見呢？

只問親朋好友好不好？因為這樣最方便了。我完全同意，這樣的選擇最容易執行。如果調查結果僅供你個人參考，我一點意見也沒有。但是，如果要把結果當做各家業者滿意百分比的估計，我們就必須問，你家親朋好友的意見可以看成是廣大手機用戶群的縮影嗎？換句話說，代表性夠不夠？我猜你的答案應該是否定的吧？

舉一個例子來說，在你的眾親朋好友中，如果有許多樂天知命、知福惜福的人，平時就不怎麼挑剔，當然也就容易對通訊品質感到滿意。而你隔壁鄰居的親朋好友群，平常對事物就比較挑剔，即使是對同樣的收訊品質，他們也可能有和你們很不一樣的意見。所以你做出的調查結果，恐怕和你鄰居做出來的結果會有很大的差距，兩者的代表性都不夠。加上常在一起的人意見可能互相影響的因素，應該已經足夠說明這樣的意見蒐集方式，明顯地不符合客觀原則。因此，這一種調查方式不恰當。

怎樣選擇蒐集意見的對象才適當呢？理想的方式是隨機選擇，而不要由個人的主觀去決定。什麼叫做隨機選擇？樂透彩就是一個很好的例子。38個號碼球，材質、大小、重量幾乎完全一樣，充分混合之後，哪6個球會跑出來，應該是完全隨機的結果，而不是任何人可以控制或預測的。

隨機選擇的好處可不只是客觀而已。假設我們已經用隨機方式選出訪問對象，也順利地完成訪問，得到了各業者的客戶當中，滿意通訊品質的百分比，這就是我們要找的估計值。請問這個從一部分客戶得來的百分比，會和用全部客戶來算的真正百分比一樣嗎？答案當然是不會，除非是湊巧發生。那我們知不知道這個估計值和真正的百分比差多少？好像也沒辦法算，我們不就是不知道真正的百分比，才要估計的嗎？

還有，如果固定訪問人數，再重新做一次隨機選擇，得到的估計百分比會不會和之前得到的一樣呢？相信你會回答不一樣。原因是訪問的對象會變，就像最近一次樂透彩抽出的號碼和上一期抽出的不一樣，是同樣的道理。這下不妙了，既然估計值不等於真正值，估計值與真正值差別多大也不知道，而且每執行一次隨機選擇，就得到一個不一樣的結果，這豈不是說，估計出來的結果簡直一文不值嗎？

如果你訪問的對象是根據主觀來選擇，差不多就符合這個結論了。可是我們用的是隨機選擇，「際遇」可就大大地不同。雖然每回隨機選擇後得出的估計值事前無法預測，然而如果不斷重複這個動作，也就是說，不斷重新做隨機選擇，便可得到許許多多的估計值，如此即使個別估計值事先無法預測，所有的估計值放在一起，卻有一種「可預知的型態」。而就是這個型態，可以把我們從「一文不值」的困境中解救出來。

如果你以為我要開始說你不懂的語言了，還請你稍安勿躁！我現在就用一個很簡單的例子，說明什麼叫做「可預知的型態」。

為了方便說明，我們假設一個很簡單的情境。假定一個班有5個學生，某次考試的成績如下：90，80，80，60，40，全班的平均成績很容易算出是70分。假設我們不知道這些分數，卻想估計全班的平均分數，而且決定用隨機方式選出二位同學，用他們的平均分數當做全班平均成績的估計值。

因為只有5個人，從裡面隨機選出兩人只有10種可能。用Ａ、Ｂ、Ｃ、Ｄ、Ｅ分別代表這5人，選出的可能結果就是ＡＢ、ＡＣ、ＡＤ、ＡＥ、ＢＣ、ＢＤ、ＢＥ、ＣＤ、ＣＥ、ＤＥ這10種組合。

如果選中Ａ和Ｂ，會把全班平均估計成85分，選中ＣＤ，就會估計成70分。你可以算算看（試試不要用計算機），上面10種可能結果的平均分數依序是：85、85、75、65、80、70、60、70、60、50。所以估計的結果最高是85分，最低是50分。請把10次可能結果平均起來，是不是得到70分，和全班的真正平均一樣？神奇吧！

這可不是巧合，而是用這種隨機選取方式的必然結果，這就是我所說的「可預知的型態」的一部分。如果你隨機選出兩人，事先不可能準確預知兩人的平均分數是多少，但是把以隨機選取方式所可能得到的所有平均分數再平均起來，卻必定等於真正的全班平均分數。

還有一個現象不知道你有沒有發現？原本全班分數最高和最低相差50分，當我們選出2個人計算平均成績時，最高和最低的差距縮小到35分。這也不是巧合，把分數平均後，必定沒有原本的個別分數散布得那麼分散，這就叫做集中化。如果你隨機選3個人的成績進行平均，會比只選兩個人所得到的結果更集中，這也屬於我所說的「可預知的型態」的一部分。當然和從很大的母體抽樣比起來，從5人母體抽樣的狀況其實不儘相同，但為了文章的可讀性，這些細節就暫且略過。好了，現在這個超迷你班級的階段任務已經完成。讓我們把從這個例子所學到的觀念，「投射」到手機通訊品質的問題上。

在迷你班的例子裡，我們因為不知道全班的分數，沒有法子算出全班的平均分數，所以隨機選出2個人，用他們的平均成績當做全班平均成績的估計值。在手機的例子裡，我們沒辦法得到每一個手機使用者的意見，所以隨機選出一些人，以他們的滿意百分比做為全部使用者滿意百分比的估計值。

雖然這個估計值不等於真正的滿意百分比，但是我們有以下的事實可以依據。首先是如果不斷地隨機選取訪問對象，人數固定，就會得到許許多多不同的估計百分比，所有這些可能得到的估計值的平均，會剛好等於真正的滿意百分比。其次是估計出來的百分比的散布狀況，會隨著訪問人數的多寡而改變。人數愈多，估計值就愈集中，而且符合「可預知的型態」。

綜合這兩點，大致可以這樣說：只要隨機選擇的訪問人數夠多，雖然每做一次隨機選擇，得到的估計值都可能不一樣，然而因為集中化的緣故，加上真正的滿意百分比又是所有估計值的平均，因此，在所有估計值都向著真正的滿意百分比集中的情況下，大部分的估計值都距離真正值不遠。這樣一來，剛才所擔心的問題不就都解決了嗎？所以重點在於：要隨機選擇訪問對象，以及訪問的人數要夠多。

筆者可沒忘記這篇文章的主題是什麼，氣氛營造到這裡，可以讓主角現身了。上面談的問題，屬於我們所稱的「統計」的領域。統計到底是什麼呢？我們先來檢視一下，剛才我們做了些什麼事。我們的目的是找資訊：所有手機使用者對各家業者通訊品質的評價。於是我們蒐集數據，得到對各業者通訊品質滿意百分比的估計值，而這個估計值對我們感興趣的問題提供了有用的資訊。統計就是從數據中獲取資訊的科學。

要從數據中找資訊，先要取得數據。光是如何取得數據，就有很多學問在裡面。在手機的例子裡，筆者已經刻意簡化問題了，只說隨機選取。這幾個字說起來容易，執行起來可是另外一回事了。樂透彩要從38個球裡面，隨機選出6個，這很容易。因為要製造38個彩球，放進合適的容器，不是什麼困難的問題。

可是，在手機的例子裡，我們面對的隨機選取對象，是廣大的手機使用大眾。相對於38個球，他們是散布在各方、數目極大的一群人。要從這樣的目標群裡做隨機選取，就必須有方法。而由於問題型態的不同，目標群的組成不同，以及執行面的一些問題等等，各自適用不同的方法。所以常用的隨機選取方法有好幾種，而樂透彩選號碼球的方法，只是其中一種而已。

有些較複雜的狀況，還會分階段地隨機選取，而且在整個選取過程中，有可能混合使用好幾種方法。解讀結果時必須有理論依據，而估計值的理論性質，當然也會隨著不同的隨機選取方法而有所不同。

還有什麼樣的問題需要從數據中找資訊呢？只要你想做分析、判斷、預測，大部分的問題都需要用到數據。因為唯有具備足夠品質的數據，才是客觀判斷的依據，否則只能做主觀的判斷。

主觀判斷要怎樣評估呢？只有天知道。但是，統計方法所做出來的結論，它的確定程度卻是可以用很科學的方法來評估的。比如說，我想開一家冰店，希望能夠預估一天可以賣多少碗冰，這樣才有利於準備材料。我猜賣多少冰應該和溫度有很大的關係，為了慎重起見，決定蒐集足夠的資訊先加以判斷，能賣幾碗冰是否的確和溫度有關。如果用統計的方法來做判斷，可以做出的結論就不只是有關係或沒關係而已。

當我們做出「有關係」的結論時，還會附帶一個「買一送一」的評估，也就是我們做出結論時，犯錯的機會有多大。也就是說，實際上「沒關係」，但我們卻做出「有關係」結論的機率有多大。這就是我所說的，對所做結論的科學評估。憑這一點，就可以把主觀判斷大大地比下去了。當然，在做出有關係的結論之後，還可以再利用合適的統計方法，根據每天的溫度預測每天可以賣幾碗冰。

統計可以處理的問題，當然不只是手機和賣冰而已。舉凡景氣預估、產品品管、行銷研究、農產品改良、新舊教學法的比較、以及新藥的研發等等，都是和許多人有切身利害關係的課題，而其中每一項都要用到數據。如果要做客觀的判斷，就應該利用統計方法。而能不能恰當地應用統計方法，會直接影響到判斷品質。讓我們用另外一個例子來說明吧！

假設我們想要知道，傳統的課堂上課方式改成線上教學，效果會不會比較好。為了知道答案，決定做一個小規模的實驗。我們在大學裡先選定某個課程，然後開兩個班，一班用傳統教學，一班用網路教學。學生可以在兩班中自由選擇一班修習。學期結束後，評估學生的學習效果，然後根據評估的結果判斷哪種教學法比較有效。

在美國有人做了這樣的實驗，而評估的結果是，上網學習的學生學習效果和課堂上的一樣好。如果把教室裡的課用網站取代，可以替學校省很多錢，因此根據這樣的研究結果，是否應該把同類型的課全面改成線上學習？

這個問題的重點是，研究結果是否可信？而結果是否可信，要根據研究方法是否合理來判斷。在這項研究中，是由學生自由選擇課堂或線上學習。而會選擇課堂學習的學生和會選擇上網的學生，會不會在本質上有所差異？比如說，比較主動積極、程度較好的學生，會不會因為不喜歡課堂學習在上課時間和進度上的限制，因而偏向於選擇上網學習呢？這是很可能的事。如果在開始比較之前，網路組的學生平均程度就比較好，這樣的比較還會公平嗎？當然不會。這樣的問題如何解決呢？

統計裡面提供一種方法，就是隨機指定一些學生到教室上課，其他的上網學習。這樣的設計，就可以「消除」程度不同及其他各式各樣可能影響結果的因素，使得比較出來的結果，可以真正顯示兩種上課方式的差別，而不是混雜了各式各樣其他因素的「混合結果」。

「比較」這種事情，大家天天在做，例如改變原料組成之後和之前的產品品質、新舊藥的療效、不同品牌產品的防曬效果、用不同牌子汽油讓車子能跑的里程數等等，這還只是隨便舉幾個例子而已。不同的狀況，需要用不同的設計去對付，才能夠真正得出我們想要的結果。如果沒有設計而隨便比一比，後果就像之前的例子，會得到一個「總匯」結果，根本沒法子把想要比較的「主角」所造成的差異分離出來。

「統計」重不重要，是不是已經很明白了呢？很複雜的統計問題，當然只能留給專業的人去做。然而，一般人需不需要懂一些基本統計呢？我覺得需要。因為不管你要不要直接處理數據，其實你都無法逃避數據的存在，因為常常有人提出一些數據來支持他們的論點。如果我們希望能夠對別人的論點做有智慧的判斷，實在應該有一些基本的統計知識。

相信每個人都同意，認識字非常重要，可是在這一個高科技的時代，認識「數」的重要性也不容忽視，而統計的內容就是教導我們如何認識「數」。基本的統計，實在是現代人應該具備的常識。

資料來源

《科學發展》2006年1月，397期，54 ~ 59頁

統計(19) 科發月刊(5221)

什麼是統計

推薦文章