談政治講「民意」,民意指的是公眾的意見,明確地說,是指某地區特定族群在某時對某特定議題的態度取向。政府施政要順應民意,選戰競爭更要顧慮民意。即使在與政治完全無關的商場上,公眾或消費者的意見,也是致勝的關鍵。
然而,「民意」說來簡單,其實問題之複雜,足以寫成好幾本書。民意的界定、民意的形成、民意的穩定性、民意的測量、民意的解讀、民意的利用甚至操控等,都不是三言兩語說得清楚的。其中關於民意的測量,也就是「民意調查」,就涉及許多理論與實務上的問題。
民意向誰問?
民意既是公眾對某特定議題的意見,則「公眾」是指哪些人?
調查對象,也就是上述「公眾」,需配合民意調查的目的而定。不當的對象選擇可能使整個民意調查完全無意義。例如,調查民眾對台北、高雄兩市市長的施政滿意度,兩地以外的民眾就不適合當做被訪問對象。而且,兩地調查結果也欠缺合適的比較基礎。另一個例子,若調查是否贊成在某地建垃圾處理場,結果將難免偏頗。這樣的問題當地民眾幾乎不可能回答「贊成」,但拿這個問題訪問非當地居民,可說幾無意義。
並非每項調查都可以很明確地決定適當的調查對象,但調查的族群不同,結果意義可能大不相同。例如,以兒童福利為主題的「民意」調查,究竟該問兒童的想法或者該問成年人的意見?關於大學多元入學,考生、大學生、考生家長及一般民眾,其表達的「民意」也各有不同含意。
不論要調查的所謂「公眾」是指甚麼樣的族群,大多數重要議題的民調對象都包含了相當龐大的人口。近代的民調推論統計學扮演了極重要的角色。
一個民調對象族群,其人口數少則數萬人,多則數百萬人。這麼多人的意見如何可以迅速得知?統計學告訴我們,只要調查一千人左右,就可以「有95%的信心說誤差不超過3.1個百分點」。表示當我們採用適當方法調查一千人,用以推估包括沒有實際調查到的那些「公眾」對某一議題做某種答覆的比例,可能的誤差大概是多少。
實際上,如果我們運氣極端不好,可能問到一千人都對某項論點不同意,但那些沒被問到的人卻都同意,那麼實際的誤差就是100個百分點而不只是3.1個百分點了!當然,如果我們採用適當的方法抽選調查對象中的這一千人,像這種極端情形是幾乎不可能的。
所以,統計學家只能「有95%的信心」保證誤差不會超過3.1個百分點。例如,調查結果這一千人中有70%贊成某種論點,在95%信心之下,我們可以說所有調查對象中會贊成該論點的比例在67%至73%之間。
並不是隨便找一千個人來訪問他們的意見就可以代表「民意」。沒有哪種方法可保證所選出的這一千人能完全反映整個族群中每個人的心聲。調查者能做的是,盡可能讓被選出的樣本受查者反映他們各自的真實狀態和想法,並做正確的紀錄。因此,最適當的辦法應是讓整個族群(調查對象)的每一成員都依一定的機會被選入樣本。
這「一定的機會」通常設計成在某種情況下是相等的,就像樂透遊戲42個球,每個球出現機會均等一樣。假設調查對象群體有十萬人,每個人給予一個編號。想像有一個滾球箱其中放了十萬顆彩球,每顆彩球對應到一個人,然後啟動機器抽出一千顆彩球,抽中的號碼就決定了誰是受查者。這種決定樣本的方法,就是「隨機抽樣」。注意!「隨機」不是「隨便」。隨便找的樣本,即使多達一萬人甚至更多,也不能代表十萬人的群體。更重要的是,無從得知這一萬人和未被問到的九萬人之間會有多大的差異。隨機抽樣也不能得知樣本和群體的意見實際差了多少,但可以知道特定差異以內的機會有多大。
調查的方式
決定了應該向誰問民意之後,接下來要如何和受查者接觸?早期的調查方式,包括派員訪問、郵寄問卷、群組填答等。電話普及之後,由於其方便、快速的特性,逐漸成為民意調查的主流。近年來,網際網路蓬勃發展,使許多人以為這將是繼電話訪查之後一項新的利器。究竟該用甚麼方法才能適當取得較接近真實的民意?
若時間上允許,例如,一般社會意向的調查,派員訪問的方式可以與受訪者做較長時間的訪談,這對了解深層的民意內容及傾向是重要的。訪員和受訪者面對面溝通,可以混合利用言語、視覺及輔助工具。當問項較複雜或問卷較長時,訪員面對面溝通也是最適當的方式。電話訪查固然在必要時也可對問項做解釋,但不能運用視覺輔助。論者認為影像電話可補其不足,但即使影像電話普及,其功效仍不及訪員親訪,而後者的缺失也將在有同步影像的電話訪查上浮現,甚或更嚴重。
訪員親訪相對於電話訪查,除了費時費錢之外,有甚麼問題?其一,過去的研究發現,可能有訪員效應存在,訪員可能影響受訪者回答。其二,有些問項或選項具敏感性,當面可能不好意思回答。對於前者,顯然電話訪查也一樣可能發生。因此,訪問的「標準化」才是解決問題的正途。就後者來說,電話訪查因為不需面對訪員,拒答的情形較少。但也有些研究指出,電話訪查結果有社會預期傾向,也就是受訪者傾向於回答社會評價認為「好」的一面。
郵寄問卷曾是許多研究者在經費、人力不充分或為圖方便而經常採用的方法。如果能配合對無回收個案的追蹤訪查,這方法仍能獲得適當的資料。不過,如果要採取嚴謹的追蹤,不論是電話催收或抽子樣本派員訪查,一則花費頗大,使郵寄問卷的經濟性和便利性盡失,再則問卷的匿名特性也將不獲信任。
電話訪查最大的好處在於時效。近年來,由於電腦科技的發展,「電腦輔助電話訪查」已成了電話訪查的標準模式。惟電話訪查有一項大問題,即有許多用戶未在電話簿登錄,使得從電話簿抽樣欠缺代表性。以民意調查來說,沒有人能保證電話號碼登不登錄和這個人對議題的反應是不相干的。相反地,例如以台灣的情形,假設電話號碼不登錄者對治安問題會有比較負面的反應似乎是合理的。利用電腦輔助電話訪查系統,隨機撥號可以提高涵蓋率,沒有刊登號碼在電話簿的也能被抽查到。然而,除非完全隨機,每個號碼被選中的機會將不相等。例如,有許多調查機構是以紙本或電子檔的電話簿為基礎做抽樣,再將末碼或末二碼隨機化。這在號碼分布不均勻的情況,抽樣依據的號碼簿分布較密集的區段,其話號使用者將有較高的被抽中機會。
網路調查是否是新興的調查利器?目前網路調查的方式有,蒐集電子信箱清單寄發問卷、在新聞群組或電子布告欄貼問卷、以及全球資訊網路設置調查網頁等。
新聞群組或電子布告欄貼問卷的方式是許多學生寫報告、研究生寫論文常採用的方法。如果問題吸引人,幸運地沒有被管理者刪除甚至禁貼,總能吸引一些同情者的回答,但顯然沒甚麼代表性可言。
網頁調查是目前常見的形式,有不少網站經常性地推出調查題目。如果是瀏覽人次眾多的網站搭配熱門新聞議題,也可吸收不少回答者。但大部分這種網頁調查只能當茶餘飯後的八卦材料,既談不上可分析之內容,也缺乏代表性。
比較可能可以接受的,是經由適當界定調查群體,取得其電子信箱清單然後隨機抽樣,以電子信箱寄發問卷。但並非這種調查方式都是可接受的!如散發廣告電子信箱那樣的寄發問卷然後靜候回收,就如「廣告回郵」一般,並不能代表所有收件者。如何界定所要調查的對象,並取得他們的電子信箱位址,其實不比一般郵寄問卷方式簡單,而在調查管理及資料處理作業上,甚至會遭遇更多困難。
如何問?
如何讓受查者確實了解你想問的,並把他心中真正的意見表露出來,是民意調查成功的重要關鍵。
關於「如何問」,在調查作業程序中包括問項設計、問卷設計及訪員提問方式三個階段。由於自然語言極不精確,同一句話不同人可能有完全不同的理解。調查問項必須十分明確,使每位受查者都能解讀出相同的意思。例如:
過去一年來,您是否看過醫生,或與醫生談過您的健康狀況?
不同受訪者對「醫生」及「看醫生或與醫生談」的界定可能有所不同,如心理醫生、接骨師、物理治療師等算不算醫生?透過電話和醫生談問題算不算「看醫生或與醫生談」?如果問
過去一年來,您是否曾到醫院或診所,或透過電話,和有正式中、西醫執照並且執業的醫生討論您的健康狀況或接受其診療?
這樣雖然比較嚕嗦,但比較不會有分歧的解讀。
問項必須明確指引受查者甚麼樣的答案是對該問項的適當回應。例如,問:「您平常怎樣到學校?」可能得到「我走某某路轉某某路」、「我搭公車」、「我和同學一起」等不同取向的回答。提供了所有可能選項供選擇的封閉式問項比較沒有這樣的問題,但也可能出現單選或複選的疑惑或非預期回答。而選項設計不當或不完備,則造成另外的問題。
問項的措詞,即使些微的差異,也可能導致很不同的結果。例如,問:「是不是應該禁止主張台獨的公開演說?」和「是不是應該允許主張台獨的公開演說?」似乎應該得到一致的結果,但實際上,可能前者認為「應該禁止」的比例會遠低於後一問項回答「不應該允許」的比例。
在封閉式問項,選項的排列順序及書面問卷上的編排形式,都可能造成答覆的偏差。就這一點來說,電腦輔助的電話訪查或訪員親訪可以隨機化改變選項順序,是其重要優點。以整份問卷來說,問項的順序也可能造成引導回答的效應。因此,在解讀調查結果數字之外,也需要考慮問卷設計。而就調查設計來說,如何安排問項使訪談過程順暢並避免引導性的答覆,是考慮重點之一。
不論電話訪查或訪員親訪,訪員是否精準地執行訪員的工作,對資料品質是重要關鍵。近五十年來,有許多學者注意到了訪員相關的誤差,而主張調查訪問的標準化。訪員在標準化訪談所要掌握的原則是︰逐字念出問項、非引導式地追問、忠實記錄受訪者的回答、以及對答案內容不做個人評斷。不過,對於調查報告的讀者來說,從調查報告及可能的附屬文件不一定能探知該調查是否符合標準化,也無從得知訪員相關的誤差。讀者可以做的是,了解調查機構平素執行調查工作前的訪員訓練及調查時的督導作業是怎樣做的。
無答覆的調查誤差
調查誤差來源有多種,前述標準化調查訪問的目的就是希望減低所謂「答覆偏差」。而無答覆,不論是有意不回答或無意的漏答,都將造成「選擇性偏誤」,也就是說,群體中將會有不同反應的成員有不同的被觀測機會,甚至有些成員不可能出現。例如網路調查,會去填問卷的和不填的,事實上有不同的特性和不同的行為模式。
前述數萬到數百萬人的群體,只要隨機抽選一千人當樣本,就可以在95%的信心下宣稱估計一項比例的「誤差不超過3.1個百分點」,是假設這一千人都會明確表示他們的意見。假設只有八百人對某問項做出回答,若沒有選擇性偏誤,等於樣本大小只有八百人,在95%信心之下只能說「誤差不超過3.5個百分點」。這裡說的「誤差」,都只是用樣本推估群體所產生的「抽樣誤差」,是整個調查誤差中一部分。
在極端的情形下,無答覆者可能通通不贊成問項涉及的議題,也可能通通贊成。例如,假設有回覆的那八百人贊成的比例是30%,這表示若一千人全部有回覆,其贊成比例應是24%到44%之間。也許未答覆者的反應不致於那麼極端,假設未回覆樣本對某問項將回答「是」的比例,是有回覆者的正負40%範圍之內,所以若那八百人答「是」的比例為30%,則未答覆的200人回答「是」的比例在18%到42%之間,而全部一千人回答「是」的比例在27.6%到32.4%之間。若有回答的比例只有七成,在無回覆者對某問項將回答「是」的比例,是有回答者的0.6到1.4倍的假設下,95%信心下的誤差(抽樣誤差加無答覆的選擇性偏差)將可達15個百分點!這麼大的誤差,可能使任何調查結果都不具意義。
民調結果可信嗎?
民調不是輕輕鬆鬆就可完成的,更不可能只要弄個網頁再搞個宣傳,就能順利獲取民意資訊。以調查目的為起點,首先要界定調查對象,擬訂調查方式及抽樣方法。另一方面,要將調查目的轉化成一個個問項並組成一份完整的問卷,經由無數次討論、預查、檢討修正才定案。接著招募、訓練訪員,然後正式調查。調查進行中,還需要有嚴謹的督導、管理。蒐集到的資料必須經過縝密的分析、解釋。在這過程中,許多環節都有可能出錯,有許多問題要考慮。
民調只是騙人的把戲,或是確實反映相關議題的民意?如果調查者確實充分理解要調查的問題,遵循科學的調查程序,在每一個環節抱持戒慎恐懼之心處理相關問題,是可能獲得可信結果的。但若調查機構未能如此,其結果可能只是「真實的謊言」。
對於新聞媒體報導的民意調查結果,你是否完全了解其內容?對報導的內容,你能相信幾分?從今而後,在閱讀或收聽這些報告時,別忘了注意報導中有沒有把調查機構、調查對象、抽樣方法、樣本大小及完成率、產生統計數字的問項實際上是怎麼問的交代清楚。如果這些訊息沒有揭露,對其結論就甭太認真了!
深度閱讀
-
鄭惟厚譯(民87)統計,讓數字說話!天下文化,臺北。
-
張美惠譯(民85)真實的謊言,時報文化,臺北。
-
王昭正、朱瑞淵譯(民88)調查研究方法,弘智文化,臺北。
-
黃朗文譯(民88)標準化的調查訪問,弘智文化,臺北。
-
田芳華譯(民88)改進調查問題:設計與評估,弘智文化,臺北。