跳到主要內容
:::
登入
註冊
網站導覽
展開搜尋
全站搜尋
熱門關鍵字:
半導體
精準醫療
太空
煙火
關閉搜尋
您的瀏覽器不支援此script語法,請點選
搜尋
使用搜尋功能。
分類
分類項目
關閉分類項目
地理
天文
化學
醫學
科技
社會科學
人類文明
地科
心理
物理
數學
環境
生物
生活科學
醫療
地球科學
Menu
關於我們
文章
熱門文章
最新文章
精選文章
科學專題
科發月刊
影音
TechTalk
科普影片
活動
學生專區
夥伴
認證
公務人員
網站導覽
English
首長信箱
常見問答
雙語詞彙
關於我們
文章
文章
熱門文章
最新文章
精選文章
科學專題
科發月刊
影音
影音
TechTalk
科普影片
活動
學生專區
夥伴
認證
認證
公務人員
:::
首頁
Pleace Login!
×
請先登入
facebook
twitter
plurk
line
中
列印
書籤
:::
什麼是統計
95/01/05
瀏覽次數
11238
鄭惟厚
|
淡江大學數學系
假設我們想做個手機大評比,這一個問題乍聽之下好像沒什麼,不過讓我們稍微探討看看,或許你等會兒會有不同的看法。關於手機,我們想知道的事情可能包括:哪個品牌手機的功能最齊全、最符合我們的需要,哪家的接通率最高、通訊的品質最佳,以及哪家的收費較優惠等等。在這些項目中,有的只要我們能夠蒐集足夠的資訊,就可以大致地判斷,比如說手機功能。但有的項目恐怕就不是那麼簡單而且具體,比如說通訊品質。假設我們想比較通訊品質,應該怎麼考慮這樣一個問題呢?
首先,應該先把問題定義清楚。通訊品質和基地台的設置有關,但是和手機有沒有關係呢?好像也有。那我們就要先弄清楚,是要比較電信業者的通訊品質,還是不同款手機的通訊品質呢?假設我們決定比較電信業者的通訊品質,再來還有問題要問,「通訊品質」的概念頗抽象的,要怎麼比呢?當然我們可以叫大家來打分數。
只是每個人的標準可能差別很大,這樣的比較方法對業者會不會不公平?應該很有可能。既然打分數會標準不一、差距太大,或者可以考慮只做大致歸類。比如說,我們只問消費者對通訊品質是否滿意,然後拿問到的結果當作評比的標準,這樣似乎是比較合適的做法。假設就這麼決定了,我們問一些人對通訊品質是否滿意,然後算出每家電信業者的滿意百分比,再比較誰的百分比最高。
一家業者的通訊品質滿意度,照理應當是這家業者所有客戶中,對品質滿意者所占的百分比。可是這個數字我們永遠沒法子知道,因為我們不可能問得到每一個人的意見,所以只能想辦法估計它。雖然問不到所有人的意見,但一定可以訪問到一部分的人,所以我們不妨問問一些人的意見,算出對各家業者滿意的百分比,然後把這些百分比當做所有客戶滿意百分比的一個估計,這似乎是很自然、直觀的一種估計方式。問題是,我們應該問誰的意見呢?
只問親朋好友好不好?因為這樣最方便了。我完全同意,這樣的選擇最容易執行。如果調查結果僅供你個人參考,我一點意見也沒有。但是,如果要把結果當做各家業者滿意百分比的估計,我們就必須問,你家親朋好友的意見可以看成是廣大手機用戶群的縮影嗎?換句話說,代表性夠不夠?我猜你的答案應該是否定的吧?
舉一個例子來說,在你的眾親朋好友中,如果有許多樂天知命、知福惜福的人,平時就不怎麼挑剔,當然也就容易對通訊品質感到滿意。而你隔壁鄰居的親朋好友群,平常對事物就比較挑剔,即使是對同樣的收訊品質,他們也可能有和你們很不一樣的意見。所以你做出的調查結果,恐怕和你鄰居做出來的結果會有很大的差距,兩者的代表性都不夠。加上常在一起的人意見可能互相影響的因素,應該已經足夠說明這樣的意見蒐集方式,明顯地不符合客觀原則。因此,這一種調查方式不恰當。
怎樣選擇蒐集意見的對象才適當呢?理想的方式是隨機選擇,而不要由個人的主觀去決定。什麼叫做隨機選擇?樂透彩就是一個很好的例子。38個號碼球,材質、大小、重量幾乎完全一樣,充分混合之後,哪6個球會跑出來,應該是完全隨機的結果,而不是任何人可以控制或預測的。
隨機選擇的好處可不只是客觀而已。假設我們已經用隨機方式選出訪問對象,也順利地完成訪問,得到了各業者的客戶當中,滿意通訊品質的百分比,這就是我們要找的估計值。請問這個從一部分客戶得來的百分比,會和用全部客戶來算的真正百分比一樣嗎?答案當然是不會,除非是湊巧發生。那我們知不知道這個估計值和真正的百分比差多少?好像也沒辦法算,我們不就是不知道真正的百分比,才要估計的嗎?
還有,如果固定訪問人數,再重新做一次隨機選擇,得到的估計百分比會不會和之前得到的一樣呢?相信你會回答不一樣。原因是訪問的對象會變,就像最近一次樂透彩抽出的號碼和上一期抽出的不一樣,是同樣的道理。這下不妙了,既然估計值不等於真正值,估計值與真正值差別多大也不知道,而且每執行一次隨機選擇,就得到一個不一樣的結果,這豈不是說,估計出來的結果簡直一文不值嗎?
如果你訪問的對象是根據主觀來選擇,差不多就符合這個結論了。可是我們用的是隨機選擇,「際遇」可就大大地不同。雖然每回隨機選擇後得出的估計值事前無法預測,然而如果不斷重複這個動作,也就是說,不斷重新做隨機選擇,便可得到許許多多的估計值,如此即使個別估計值事先無法預測,所有的估計值放在一起,卻有一種「可預知的型態」。而就是這個型態,可以把我們從「一文不值」的困境中解救出來。
如果你以為我要開始說你不懂的語言了,還請你稍安勿躁!我現在就用一個很簡單的例子,說明什麼叫做「可預知的型態」。
為了方便說明,我們假設一個很簡單的情境。假定一個班有5個學生,某次考試的成績如下:90,80,80,60,40,全班的平均成績很容易算出是70分。假設我們不知道這些分數,卻想估計全班的平均分數,而且決定用隨機方式選出二位同學,用他們的平均分數當做全班平均成績的估計值。
因為只有5個人,從裡面隨機選出兩人只有10種可能。用A、B、C、D、E分別代表這5人,選出的可能結果就是AB、AC、AD、AE、BC、BD、BE、CD、CE、DE這10種組合。
如果選中A和B,會把全班平均估計成85分,選中CD,就會估計成70分。你可以算算看(試試不要用計算機),上面10種可能結果的平均分數依序是:85、85、75、65、80、70、60、70、60、50。所以估計的結果最高是85分,最低是50分。請把10次可能結果平均起來,是不是得到70分,和全班的真正平均一樣?神奇吧!
這可不是巧合,而是用這種隨機選取方式的必然結果,這就是我所說的「可預知的型態」的一部分。如果你隨機選出兩人,事先不可能準確預知兩人的平均分數是多少,但是把以隨機選取方式所可能得到的所有平均分數再平均起來,卻必定等於真正的全班平均分數。
還有一個現象不知道你有沒有發現?原本全班分數最高和最低相差50分,當我們選出2個人計算平均成績時,最高和最低的差距縮小到35分。這也不是巧合,把分數平均後,必定沒有原本的個別分數散布得那麼分散,這就叫做集中化。如果你隨機選3個人的成績進行平均,會比只選兩個人所得到的結果更集中,這也屬於我所說的「可預知的型態」的一部分。當然和從很大的母體抽樣比起來,從5人母體抽樣的狀況其實不儘相同,但為了文章的可讀性,這些細節就暫且略過。好了,現在這個超迷你班級的階段任務已經完成。讓我們把從這個例子所學到的觀念,「投射」到手機通訊品質的問題上。
在迷你班的例子裡,我們因為不知道全班的分數,沒有法子算出全班的平均分數,所以隨機選出2個人,用他們的平均成績當做全班平均成績的估計值。在手機的例子裡,我們沒辦法得到每一個手機使用者的意見,所以隨機選出一些人,以他們的滿意百分比做為全部使用者滿意百分比的估計值。
雖然這個估計值不等於真正的滿意百分比,但是我們有以下的事實可以依據。首先是如果不斷地隨機選取訪問對象,人數固定,就會得到許許多多不同的估計百分比,所有這些可能得到的估計值的平均,會剛好等於真正的滿意百分比。其次是估計出來的百分比的散布狀況,會隨著訪問人數的多寡而改變。人數愈多,估計值就愈集中,而且符合「可預知的型態」。
綜合這兩點,大致可以這樣說:只要隨機選擇的訪問人數夠多,雖然每做一次隨機選擇,得到的估計值都可能不一樣,然而因為集中化的緣故,加上真正的滿意百分比又是所有估計值的平均,因此,在所有估計值都向著真正的滿意百分比集中的情況下,大部分的估計值都距離真正值不遠。這樣一來,剛才所擔心的問題不就都解決了嗎?所以重點在於:要隨機選擇訪問對象,以及訪問的人數要夠多。
筆者可沒忘記這篇文章的主題是什麼,氣氛營造到這裡,可以讓主角現身了。上面談的問題,屬於我們所稱的「統計」的領域。統計到底是什麼呢?我們先來檢視一下,剛才我們做了些什麼事。我們的目的是找資訊:所有手機使用者對各家業者通訊品質的評價。於是我們蒐集數據,得到對各業者通訊品質滿意百分比的估計值,而這個估計值對我們感興趣的問題提供了有用的資訊。統計就是從數據中獲取資訊的科學。
要從數據中找資訊,先要取得數據。光是如何取得數據,就有很多學問在裡面。在手機的例子裡,筆者已經刻意簡化問題了,只說隨機選取。這幾個字說起來容易,執行起來可是另外一回事了。樂透彩要從38個球裡面,隨機選出6個,這很容易。因為要製造38個彩球,放進合適的容器,不是什麼困難的問題。
可是,在手機的例子裡,我們面對的隨機選取對象,是廣大的手機使用大眾。相對於38個球,他們是散布在各方、數目極大的一群人。要從這樣的目標群裡做隨機選取,就必須有方法。而由於問題型態的不同,目標群的組成不同,以及執行面的一些問題等等,各自適用不同的方法。所以常用的隨機選取方法有好幾種,而樂透彩選號碼球的方法,只是其中一種而已。
有些較複雜的狀況,還會分階段地隨機選取,而且在整個選取過程中,有可能混合使用好幾種方法。解讀結果時必須有理論依據,而估計值的理論性質,當然也會隨著不同的隨機選取方法而有所不同。
還有什麼樣的問題需要從數據中找資訊呢?只要你想做分析、判斷、預測,大部分的問題都需要用到數據。因為唯有具備足夠品質的數據,才是客觀判斷的依據,否則只能做主觀的判斷。
主觀判斷要怎樣評估呢?只有天知道。但是,統計方法所做出來的結論,它的確定程度卻是可以用很科學的方法來評估的。比如說,我想開一家冰店,希望能夠預估一天可以賣多少碗冰,這樣才有利於準備材料。我猜賣多少冰應該和溫度有很大的關係,為了慎重起見,決定蒐集足夠的資訊先加以判斷,能賣幾碗冰是否的確和溫度有關。如果用統計的方法來做判斷,可以做出的結論就不只是有關係或沒關係而已。
當我們做出「有關係」的結論時,還會附帶一個「買一送一」的評估,也就是我們做出結論時,犯錯的機會有多大。也就是說,實際上「沒關係」,但我們卻做出「有關係」結論的機率有多大。這就是我所說的,對所做結論的科學評估。憑這一點,就可以把主觀判斷大大地比下去了。當然,在做出有關係的結論之後,還可以再利用合適的統計方法,根據每天的溫度預測每天可以賣幾碗冰。
統計可以處理的問題,當然不只是手機和賣冰而已。舉凡景氣預估、產品品管、行銷研究、農產品改良、新舊教學法的比較、以及新藥的研發等等,都是和許多人有切身利害關係的課題,而其中每一項都要用到數據。如果要做客觀的判斷,就應該利用統計方法。而能不能恰當地應用統計方法,會直接影響到判斷品質。讓我們用另外一個例子來說明吧!
假設我們想要知道,傳統的課堂上課方式改成線上教學,效果會不會比較好。為了知道答案,決定做一個小規模的實驗。我們在大學裡先選定某個課程,然後開兩個班,一班用傳統教學,一班用網路教學。學生可以在兩班中自由選擇一班修習。學期結束後,評估學生的學習效果,然後根據評估的結果判斷哪種教學法比較有效。
在美國有人做了這樣的實驗,而評估的結果是,上網學習的學生學習效果和課堂上的一樣好。如果把教室裡的課用網站取代,可以替學校省很多錢,因此根據這樣的研究結果,是否應該把同類型的課全面改成線上學習?
這個問題的重點是,研究結果是否可信?而結果是否可信,要根據研究方法是否合理來判斷。在這項研究中,是由學生自由選擇課堂或線上學習。而會選擇課堂學習的學生和會選擇上網的學生,會不會在本質上有所差異?比如說,比較主動積極、程度較好的學生,會不會因為不喜歡課堂學習在上課時間和進度上的限制,因而偏向於選擇上網學習呢?這是很可能的事。如果在開始比較之前,網路組的學生平均程度就比較好,這樣的比較還會公平嗎?當然不會。這樣的問題如何解決呢?
統計裡面提供一種方法,就是隨機指定一些學生到教室上課,其他的上網學習。這樣的設計,就可以「消除」程度不同及其他各式各樣可能影響結果的因素,使得比較出來的結果,可以真正顯示兩種上課方式的差別,而不是混雜了各式各樣其他因素的「混合結果」。
「比較」這種事情,大家天天在做,例如改變原料組成之後和之前的產品品質、新舊藥的療效、不同品牌產品的防曬效果、用不同牌子汽油讓車子能跑的里程數等等,這還只是隨便舉幾個例子而已。不同的狀況,需要用不同的設計去對付,才能夠真正得出我們想要的結果。如果沒有設計而隨便比一比,後果就像之前的例子,會得到一個「總匯」結果,根本沒法子把想要比較的「主角」所造成的差異分離出來。
「統計」重不重要,是不是已經很明白了呢?很複雜的統計問題,當然只能留給專業的人去做。然而,一般人需不需要懂一些基本統計呢?我覺得需要。因為不管你要不要直接處理數據,其實你都無法逃避數據的存在,因為常常有人提出一些數據來支持他們的論點。如果我們希望能夠對別人的論點做有智慧的判斷,實在應該有一些基本的統計知識。
相信每個人都同意,認識字非常重要,可是在這一個高科技的時代,認識「數」的重要性也不容忽視,而統計的內容就是教導我們如何認識「數」。基本的統計,實在是現代人應該具備的常識。
資料來源
《科學發展》2006年1月,397期,54 ~ 59頁
統計(18)
科發月刊(5221)
推薦文章
113/08/28
幹細胞能拯救受傷的眼角膜,未來有機會治療「乾眼症」嗎?
寒波
|
科技大觀園特約編輯
儲存書籤
113/11/29
必須持續開著警示燈 提醒大眾關注科學領域中的偏見問題
單文婷
|
國立臺灣藝術大學影音創作與數位媒體產業研究所
儲存書籤
113/09/30
氣候變遷下的農業改革:韌性與淨零的未來進行式
陳儀珈
|
科技大觀園特約編輯
儲存書籤
113/10/08
當 AI 晶片全面進攻終端裝置,產業有哪些挑戰與應用?
簡永昌
|
科技大觀園特約編輯
儲存書籤
OPEN
關於我們
關於我們
文章
熱門文章
最新文章
精選文章
科學專題
影音
科普影片
TechTalk
活動
活動
學生專區
學生專區
回頂部