跳到主要內容

科技大觀園商標

分類項目
Menu

什麼是統計

95/01/05 瀏覽次數 11143
假設我們想做個手機大評比,這一個問題乍聽之下好像沒什麼,不過讓我們稍微探討看看,或許你等會兒會有不同的看法。關於手機,我們想知道的事情可能包括:哪個品牌手機的功能最齊全、最符合我們的需要,哪家的接通率最高、通訊的品質最佳,以及哪家的收費較優惠等等。在這些項目中,有的只要我們能夠蒐集足夠的資訊,就可以大致地判斷,比如說手機功能。但有的項目恐怕就不是那麼簡單而且具體,比如說通訊品質。假設我們想比較通訊品質,應該怎麼考慮這樣一個問題呢?

首先,應該先把問題定義清楚。通訊品質和基地台的設置有關,但是和手機有沒有關係呢?好像也有。那我們就要先弄清楚,是要比較電信業者的通訊品質,還是不同款手機的通訊品質呢?假設我們決定比較電信業者的通訊品質,再來還有問題要問,「通訊品質」的概念頗抽象的,要怎麼比呢?當然我們可以叫大家來打分數。

只是每個人的標準可能差別很大,這樣的比較方法對業者會不會不公平?應該很有可能。既然打分數會標準不一、差距太大,或者可以考慮只做大致歸類。比如說,我們只問消費者對通訊品質是否滿意,然後拿問到的結果當作評比的標準,這樣似乎是比較合適的做法。假設就這麼決定了,我們問一些人對通訊品質是否滿意,然後算出每家電信業者的滿意百分比,再比較誰的百分比最高。

一家業者的通訊品質滿意度,照理應當是這家業者所有客戶中,對品質滿意者所占的百分比。可是這個數字我們永遠沒法子知道,因為我們不可能問得到每一個人的意見,所以只能想辦法估計它。雖然問不到所有人的意見,但一定可以訪問到一部分的人,所以我們不妨問問一些人的意見,算出對各家業者滿意的百分比,然後把這些百分比當做所有客戶滿意百分比的一個估計,這似乎是很自然、直觀的一種估計方式。問題是,我們應該問誰的意見呢?

只問親朋好友好不好?因為這樣最方便了。我完全同意,這樣的選擇最容易執行。如果調查結果僅供你個人參考,我一點意見也沒有。但是,如果要把結果當做各家業者滿意百分比的估計,我們就必須問,你家親朋好友的意見可以看成是廣大手機用戶群的縮影嗎?換句話說,代表性夠不夠?我猜你的答案應該是否定的吧?

舉一個例子來說,在你的眾親朋好友中,如果有許多樂天知命、知福惜福的人,平時就不怎麼挑剔,當然也就容易對通訊品質感到滿意。而你隔壁鄰居的親朋好友群,平常對事物就比較挑剔,即使是對同樣的收訊品質,他們也可能有和你們很不一樣的意見。所以你做出的調查結果,恐怕和你鄰居做出來的結果會有很大的差距,兩者的代表性都不夠。加上常在一起的人意見可能互相影響的因素,應該已經足夠說明這樣的意見蒐集方式,明顯地不符合客觀原則。因此,這一種調查方式不恰當。

怎樣選擇蒐集意見的對象才適當呢?理想的方式是隨機選擇,而不要由個人的主觀去決定。什麼叫做隨機選擇?樂透彩就是一個很好的例子。38個號碼球,材質、大小、重量幾乎完全一樣,充分混合之後,哪6個球會跑出來,應該是完全隨機的結果,而不是任何人可以控制或預測的。

隨機選擇的好處可不只是客觀而已。假設我們已經用隨機方式選出訪問對象,也順利地完成訪問,得到了各業者的客戶當中,滿意通訊品質的百分比,這就是我們要找的估計值。請問這個從一部分客戶得來的百分比,會和用全部客戶來算的真正百分比一樣嗎?答案當然是不會,除非是湊巧發生。那我們知不知道這個估計值和真正的百分比差多少?好像也沒辦法算,我們不就是不知道真正的百分比,才要估計的嗎?

還有,如果固定訪問人數,再重新做一次隨機選擇,得到的估計百分比會不會和之前得到的一樣呢?相信你會回答不一樣。原因是訪問的對象會變,就像最近一次樂透彩抽出的號碼和上一期抽出的不一樣,是同樣的道理。這下不妙了,既然估計值不等於真正值,估計值與真正值差別多大也不知道,而且每執行一次隨機選擇,就得到一個不一樣的結果,這豈不是說,估計出來的結果簡直一文不值嗎?

如果你訪問的對象是根據主觀來選擇,差不多就符合這個結論了。可是我們用的是隨機選擇,「際遇」可就大大地不同。雖然每回隨機選擇後得出的估計值事前無法預測,然而如果不斷重複這個動作,也就是說,不斷重新做隨機選擇,便可得到許許多多的估計值,如此即使個別估計值事先無法預測,所有的估計值放在一起,卻有一種「可預知的型態」。而就是這個型態,可以把我們從「一文不值」的困境中解救出來。

如果你以為我要開始說你不懂的語言了,還請你稍安勿躁!我現在就用一個很簡單的例子,說明什麼叫做「可預知的型態」。

為了方便說明,我們假設一個很簡單的情境。假定一個班有5個學生,某次考試的成績如下:90,80,80,60,40,全班的平均成績很容易算出是70分。假設我們不知道這些分數,卻想估計全班的平均分數,而且決定用隨機方式選出二位同學,用他們的平均分數當做全班平均成績的估計值。

因為只有5個人,從裡面隨機選出兩人只有10種可能。用A、B、C、D、E分別代表這5人,選出的可能結果就是AB、AC、AD、AE、BC、BD、BE、CD、CE、DE這10種組合。

如果選中A和B,會把全班平均估計成85分,選中CD,就會估計成70分。你可以算算看(試試不要用計算機),上面10種可能結果的平均分數依序是:85、85、75、65、80、70、60、70、60、50。所以估計的結果最高是85分,最低是50分。請把10次可能結果平均起來,是不是得到70分,和全班的真正平均一樣?神奇吧!

這可不是巧合,而是用這種隨機選取方式的必然結果,這就是我所說的「可預知的型態」的一部分。如果你隨機選出兩人,事先不可能準確預知兩人的平均分數是多少,但是把以隨機選取方式所可能得到的所有平均分數再平均起來,卻必定等於真正的全班平均分數。

還有一個現象不知道你有沒有發現?原本全班分數最高和最低相差50分,當我們選出2個人計算平均成績時,最高和最低的差距縮小到35分。這也不是巧合,把分數平均後,必定沒有原本的個別分數散布得那麼分散,這就叫做集中化。如果你隨機選3個人的成績進行平均,會比只選兩個人所得到的結果更集中,這也屬於我所說的「可預知的型態」的一部分。當然和從很大的母體抽樣比起來,從5人母體抽樣的狀況其實不儘相同,但為了文章的可讀性,這些細節就暫且略過。好了,現在這個超迷你班級的階段任務已經完成。讓我們把從這個例子所學到的觀念,「投射」到手機通訊品質的問題上。

在迷你班的例子裡,我們因為不知道全班的分數,沒有法子算出全班的平均分數,所以隨機選出2個人,用他們的平均成績當做全班平均成績的估計值。在手機的例子裡,我們沒辦法得到每一個手機使用者的意見,所以隨機選出一些人,以他們的滿意百分比做為全部使用者滿意百分比的估計值。

雖然這個估計值不等於真正的滿意百分比,但是我們有以下的事實可以依據。首先是如果不斷地隨機選取訪問對象,人數固定,就會得到許許多多不同的估計百分比,所有這些可能得到的估計值的平均,會剛好等於真正的滿意百分比。其次是估計出來的百分比的散布狀況,會隨著訪問人數的多寡而改變。人數愈多,估計值就愈集中,而且符合「可預知的型態」。

綜合這兩點,大致可以這樣說:只要隨機選擇的訪問人數夠多,雖然每做一次隨機選擇,得到的估計值都可能不一樣,然而因為集中化的緣故,加上真正的滿意百分比又是所有估計值的平均,因此,在所有估計值都向著真正的滿意百分比集中的情況下,大部分的估計值都距離真正值不遠。這樣一來,剛才所擔心的問題不就都解決了嗎?所以重點在於:要隨機選擇訪問對象,以及訪問的人數要夠多。

筆者可沒忘記這篇文章的主題是什麼,氣氛營造到這裡,可以讓主角現身了。上面談的問題,屬於我們所稱的「統計」的領域。統計到底是什麼呢?我們先來檢視一下,剛才我們做了些什麼事。我們的目的是找資訊:所有手機使用者對各家業者通訊品質的評價。於是我們蒐集數據,得到對各業者通訊品質滿意百分比的估計值,而這個估計值對我們感興趣的問題提供了有用的資訊。統計就是從數據中獲取資訊的科學。

要從數據中找資訊,先要取得數據。光是如何取得數據,就有很多學問在裡面。在手機的例子裡,筆者已經刻意簡化問題了,只說隨機選取。這幾個字說起來容易,執行起來可是另外一回事了。樂透彩要從38個球裡面,隨機選出6個,這很容易。因為要製造38個彩球,放進合適的容器,不是什麼困難的問題。

可是,在手機的例子裡,我們面對的隨機選取對象,是廣大的手機使用大眾。相對於38個球,他們是散布在各方、數目極大的一群人。要從這樣的目標群裡做隨機選取,就必須有方法。而由於問題型態的不同,目標群的組成不同,以及執行面的一些問題等等,各自適用不同的方法。所以常用的隨機選取方法有好幾種,而樂透彩選號碼球的方法,只是其中一種而已。

有些較複雜的狀況,還會分階段地隨機選取,而且在整個選取過程中,有可能混合使用好幾種方法。解讀結果時必須有理論依據,而估計值的理論性質,當然也會隨著不同的隨機選取方法而有所不同。

還有什麼樣的問題需要從數據中找資訊呢?只要你想做分析、判斷、預測,大部分的問題都需要用到數據。因為唯有具備足夠品質的數據,才是客觀判斷的依據,否則只能做主觀的判斷。

主觀判斷要怎樣評估呢?只有天知道。但是,統計方法所做出來的結論,它的確定程度卻是可以用很科學的方法來評估的。比如說,我想開一家冰店,希望能夠預估一天可以賣多少碗冰,這樣才有利於準備材料。我猜賣多少冰應該和溫度有很大的關係,為了慎重起見,決定蒐集足夠的資訊先加以判斷,能賣幾碗冰是否的確和溫度有關。如果用統計的方法來做判斷,可以做出的結論就不只是有關係或沒關係而已。

當我們做出「有關係」的結論時,還會附帶一個「買一送一」的評估,也就是我們做出結論時,犯錯的機會有多大。也就是說,實際上「沒關係」,但我們卻做出「有關係」結論的機率有多大。這就是我所說的,對所做結論的科學評估。憑這一點,就可以把主觀判斷大大地比下去了。當然,在做出有關係的結論之後,還可以再利用合適的統計方法,根據每天的溫度預測每天可以賣幾碗冰。

統計可以處理的問題,當然不只是手機和賣冰而已。舉凡景氣預估、產品品管、行銷研究、農產品改良、新舊教學法的比較、以及新藥的研發等等,都是和許多人有切身利害關係的課題,而其中每一項都要用到數據。如果要做客觀的判斷,就應該利用統計方法。而能不能恰當地應用統計方法,會直接影響到判斷品質。讓我們用另外一個例子來說明吧!

假設我們想要知道,傳統的課堂上課方式改成線上教學,效果會不會比較好。為了知道答案,決定做一個小規模的實驗。我們在大學裡先選定某個課程,然後開兩個班,一班用傳統教學,一班用網路教學。學生可以在兩班中自由選擇一班修習。學期結束後,評估學生的學習效果,然後根據評估的結果判斷哪種教學法比較有效。

在美國有人做了這樣的實驗,而評估的結果是,上網學習的學生學習效果和課堂上的一樣好。如果把教室裡的課用網站取代,可以替學校省很多錢,因此根據這樣的研究結果,是否應該把同類型的課全面改成線上學習?

這個問題的重點是,研究結果是否可信?而結果是否可信,要根據研究方法是否合理來判斷。在這項研究中,是由學生自由選擇課堂或線上學習。而會選擇課堂學習的學生和會選擇上網的學生,會不會在本質上有所差異?比如說,比較主動積極、程度較好的學生,會不會因為不喜歡課堂學習在上課時間和進度上的限制,因而偏向於選擇上網學習呢?這是很可能的事。如果在開始比較之前,網路組的學生平均程度就比較好,這樣的比較還會公平嗎?當然不會。這樣的問題如何解決呢?

統計裡面提供一種方法,就是隨機指定一些學生到教室上課,其他的上網學習。這樣的設計,就可以「消除」程度不同及其他各式各樣可能影響結果的因素,使得比較出來的結果,可以真正顯示兩種上課方式的差別,而不是混雜了各式各樣其他因素的「混合結果」。

「比較」這種事情,大家天天在做,例如改變原料組成之後和之前的產品品質、新舊藥的療效、不同品牌產品的防曬效果、用不同牌子汽油讓車子能跑的里程數等等,這還只是隨便舉幾個例子而已。不同的狀況,需要用不同的設計去對付,才能夠真正得出我們想要的結果。如果沒有設計而隨便比一比,後果就像之前的例子,會得到一個「總匯」結果,根本沒法子把想要比較的「主角」所造成的差異分離出來。

「統計」重不重要,是不是已經很明白了呢?很複雜的統計問題,當然只能留給專業的人去做。然而,一般人需不需要懂一些基本統計呢?我覺得需要。因為不管你要不要直接處理數據,其實你都無法逃避數據的存在,因為常常有人提出一些數據來支持他們的論點。如果我們希望能夠對別人的論點做有智慧的判斷,實在應該有一些基本的統計知識。

相信每個人都同意,認識字非常重要,可是在這一個高科技的時代,認識「數」的重要性也不容忽視,而統計的內容就是教導我們如何認識「數」。基本的統計,實在是現代人應該具備的常識。
OPEN
回頂部