行為學習的探索:偏最小平方法結構方程模型

 
2017/11/06 李承傑 | 成功大學教育研究所
董旭英 | 成功大學教育研究所     488
 

如果研究者的資料型態是小樣本、非常態分配、有形成性指標的測量模型、屬於預測性研究或模型比較複雜,可以思考一下偏最小平方法的統計方法。

 

在社會科學量化分析的研究中,早期盛行的多變量統計分析法多以迴歸分析的概念為基礎,例如變異數分析、因素分析、集群分析、路徑分析等,這些被瑞典經濟學家Claes Fornell稱為第一代的統計技術。但隨著70年代科技的快速發展,前述方法已經無法解釋較複雜的社會情境,統計分析術便進入第二代。

 

第二代的統計技術是透過觀察變項,把間接測量到的潛在變項納入分析,並計算觀察變項的測量誤差,這就是目前最盛行的結構方程模型。結構方程模型出自瑞典統計學家Karl Gustav Jöreskog,他提出線性結構關係的概念模型,並結合了因素分析與路徑分析兩大技術,成為70年代以來最重要的量化分析法,可應用在管理學、教育學、心理學等多個社會科學領域。

 

結構方程模型可分為兩種類型,一種是以共變數為基礎的結構方程模型,是運算分析觀察變項的共變數結構,藉由定義一個因素結構來解釋變項間的共變關係,因此稱為以共變數為基礎的結構方程模型;另一種是以變異數為基礎的結構方程模型,也就是偏最小平方法,利用觀察變項的線性組合定義出一個主成分結構後,再利用迴歸原理解釋檢驗主成分間的預測與解釋關係,因此也稱為以主成分為基礎的結構方程模型。

 

由於以共變數為基礎的結構方程模型發展已相當成熟,且應用在許多科學領域,大眾較為熟悉,因此本文將簡介偏最小平方法結構方程模型的原理與運算、統計特性、與結構方程模型的差異,以及其優勢和限制。

 

偏最小平方法與結構方程模型的差異

 

偏最小平方法是瑞典統計學家Herman Wold基於經濟計量分析的需求所發展出來的,因為結構方程模型主要是針對誤差結構進行運算,預測剩餘的估計殘差,而且能夠分離測量誤差,使得結構方程模型對於潛在變項較符合心理計量所稱的構念,更重要的是變項分配必須符合多元常態性。

 

可是Wold認為實務上的統計並不見得會滿足這樣的假設,因此他放棄了對於多元常態假設的天真期待,另行發展了偏最小平方法的運算方法,不但較符合實務上的型態,也更能滿足量化研究的需求。

 

這一改進使得偏最小平方法在化學計量領域獲得重視與普及,後來更廣被應用在資管、行銷、商學、休旅觀光等領域。

 

偏最小平方法的估計運算

 

偏最小平方法的運算是由一系列的加權迴歸方程式所完成,藉由一組加權係數調整迴歸方程式,以獲得結構模型的最佳化。

 

其估計程序有四個步驟:首先,進行測量模型潛在變項的線性組合,把潛在變項以各該相對應的測量(觀察)變項做線性整合,獲得標準化分數做為潛在變項分數。其次,估計結構模型權重,結構模型權重是由前一步驟得到的潛在變項分數,另透過各潛在變項的關聯強度,採用迴歸方程式或路徑分析參數來求解。然後,對結構模型潛在變項做線性組合,完成上述兩步驟所得到的權重與潛在分數,就可以計算出新的結構模型潛在變項估計數。

 

最後,再估計測量模型權數,把新的結構模型潛在變項估計數與各對應的測量變項的相關係數或迴歸係數做為測量模型權重,再次代入第一步驟求取測量模型潛在變項分數做線性組合。如此反覆疊代估計,直到獲得的測量模型權重收斂至不再有明顯改變時才停止計算。

 

從上述簡易地描述偏最小平方法的估計運算過程,可發現它其實很像傳統主成分分析與迴歸分析的方法,在進行預測時具有相當的便捷性與彈性,而且重視實務應用與實際預測控制的效用,卻也會減損理論價值與概念的詮釋性,不過這並非偏最小平方法發展的目的,因此也不算是個缺點。

 

偏最小平方法的統計特性

 

從偏最小平方法的發展歷程與運算技術,可發現它有幾項統計特性。首先,它是無分配的迴歸分析技術,也就是說偏最小平方法並沒有限制在多元常態分配的假設下,相較於結構方程模型,其估計運算必須假設是在常態機率的模式下,因此會受到多元常態分配的假設限制,但如果資料型態是非常態分配時,所得結果就會偏誤了。

 

因此,偏最小平方法在小樣本時也可以獲得理想的估計數,而結構方程模型卻非得要大樣本以維繫估計解的不偏性。雖然如此,如果資料型態是小樣本又非常態分配時,其實偏最小平方法也需要相當規模的樣本才能獲得穩定的估計解。

 

其次,上述提到偏最小平方法可用在小樣本資料,這也是它的統計特性。不過小樣本或樣本數小於測量變項數目時,也可能得到不理想的估計解,只有當樣本越大時,才可以獲得越穩健的結果。

 

休士頓大學教授也是《美國管理資訊系統季刊》(Management Information Systems Quarterly)季刊主編Wayne W. Chin曾提出十倍法則,也就是說計算的基礎應以最大的潛在變項的測量變項數目為基準,樣本數必須是該因素的測量變項數目的10倍,或最能被解釋變相解釋的依變項的潛在變項,其測量變項數目的10倍才適當。

 

再者,由於偏最小平方法對於潛在變項的分配並沒有限定是多元常態分配的假定,因此抽樣分配未能得知,為了進行參數估計的顯著性考驗,便採用了無母數估計的拔靴估計法獲得抽樣分配的標準誤差。由於這種重複取樣策略對於樣本數目沒有限制,照樣可以獲得抽樣分配的標準誤差,但是樣本數仍需適量才可相信其顯著性考驗。若是在小樣本規模下重複取樣,所得到的抽樣誤差很有可能是無關訊息的抽樣,而非真分數的隨機變異,那其顯著性考驗就不可信了。

 

最後,偏最小平方法比較不受迴歸分析中多元共線性問題的影響,因為它所萃取出的因素是零相關的正交因素,因此在做為解釋變項的潛在變項對於依變項的迴歸分析不會受到傳統的多元共線性問題的影響。但是,在測量模型方面,如果研究者假設背後有多個潛在變項,但其所使用的測量變項間有高相關時,就不容易形成穩定的因素結構,仍會受到測量變項之間具有共線性的影響。

 

形成性指標與反映性指標

 

在發展潛在變項的構念時,必須思考測量因果的方向性。由於方向性的不同會導致兩種類型的測量設定,其一是反映性指標,是指潛在構念為因影響其觀察變項,同一潛在構念的觀察變項之間有高度的相關性。另一種是形成性指標,是指觀察變項為因影響其潛在構念。舉例來說,測量到餐廳用餐滿意度的潛在構念,會因為觀察變項也就是問卷試題的設計不同而有差異。

 

例如,就反映性指標而言,因為我到這家餐廳用餐很滿意,導致我喜歡這家餐廳,我下次會再來用餐,我也會推薦他人來用餐等。因此,到餐廳用餐的滿意度是因,即潛在構念,而導致的結果是果,即觀察變項。相對地,就形成性指標而言,到這家餐廳用餐的滿意度是結果,其可能原因是服務人員很親切友善、餐點很好吃、用餐環境很棒等,因此這些原因是觀察變項,導致了對這家餐廳的滿意度評定。

 

在結構方程模型中,因為所關心的是測量變項的共變如何有效解釋,所以測量模型必須具備測量變項是潛在變數的反映性關係,也就是說採用的是反映性指標。相對地,因為偏最小平方法所定義的潛在變項並沒有測量誤差,組合得到的主成分所反映的是各測量變項的變異數,而非兩兩測量變項的共變數,所以不需疊代估計讓共變數矩陣的殘差最小化。

 

偏最小平方法的主成分是由測量變項線性轉換而來,也可以由主成分倒轉其線性關係還原出原始測量變項的關係。也就是說,偏最小平方法其測量變項的變異數是由潛在變項所決定,潛在變項可以設定為影響測量變項的變異數,即反映性指標,也可以設定成潛在變項的變異數由測量變項來決定,即形成性指標。

 

它的測量模型不僅可以使用反映性指標,也可以接受潛在變項是測量變項的形成性指標。這不僅是偏最小平方法在運算上的優勢,也可以解決更多量化研究上的問題,是一種方法學上的優勢,這種彈性是傳統結構方程模型所不及的。

 

測量模型的設定要採用形成性指標還是反映性指標,這不是個容易明確回答的問題,因為這議題至今在許多學科中仍爭議不休。不過測量模型究竟是形成性或反映性指標,可由研究者基於不同的考量來決定,基本上還是得以理論的原理為基礎。在SmartPLS軟體中,有一項四分體檢定(tetrad test)可用來檢驗測量模型是否具有反映性指標的測量本質,以初步判定測量模型是形成性或反映性的診斷方法。

 

 偏最小平方法的優勢

 

因為偏最小平方法的主要功能在於預測與解釋,所以仍應以模型解釋力與效果量的方式評估模型的優劣。在SmartPLS軟體中,不僅提供了迴歸解釋力(R2)的概念,也提供了外生變項對內生變項的影響力指標(f 2),以及採用blindfolding法計算內生變項的預測相關性(Stone-Geisser’s Q 2)。

 

其次,因為偏最小平方法的主要程序是把兩組測量變項進行線性組合,簡化幾個主成分分數進行一般最小平方迴歸分析,所以即使樣本數不多也可用來估計測量模型與結構模型。再者,由於路徑分析是迴歸的延伸,以迴歸為核心概念的偏最小平方法也可以延伸到路徑模型的檢驗,以及中介效果分析。

 

此外,如果模型中有調節變數,偏最小平方法也能夠套用交互作用迴歸,或多群組比較策略,來得到有效率的處理。簡言之,偏最小平方法相較於結構方程模型對樣本條件需求較少,不需分析資料是否符合多元常態分配,可以處理多個構念的複雜結構模型,同時處理反映性指標和形成性指標的構測量模型,特別適用於預測與強調模型的整體解釋變異程度。

 

如果研究者的資料型態是小樣本、非常態分配、有形成性指標的測量模型、屬於預測性研究、模型比較複雜,可以思考一下偏最小平方法的統計方法,而且可以處理多群組比較、調節作用與中介效果的議題。

 

限制與問題

 

偏最小平方法的優勢是採用明確的變項變換數學模型來處理測量問題,但其缺點也是發生在測量模型的建構上,因為其測量模型不容易找到強而有力的理論或實徵證據來支持,因此在潛在變項的命名與解釋時,最好能夠找到適當的研究文獻來支持測量模型。

 

其次,偏最小平方法在參數意義的決定上欠缺有力的統計檢驗準則,無法進行模型適配的客觀檢驗,因為主成分分析對於潛在變項的數值分配並沒有明確的假定,在其分配模型未知的情形下,要進行顯著性考驗與模型適配檢驗確有其困難。關於這一問題,法國Hautes管理學院教授Michel Tenehaus發展出一個偏最小平方法的整體適配性指標,做為可能驗證偏最小平方法整體模型的方案。

 

再者,以主成分分析為基礎的偏最小平方法估計得到的測量模型係數優於以共變數為基礎的結構方程模型,但是偏最小平方法所得到的結構係數卻比結構方程模型的低。也就是說,當研究者所關心的議題與抽象心理構念有關時,若以偏最小平方法結構方程模型進行參數估計與運算時,則會有測量模型參數被低估,結構模型參數被高估的現象。

 

最後,在測量模型方面,如果研究者假設背後有多個潛在變項,但其所使用的測量變項間有高相關時,就不容易形成穩定的因素結構,仍會受到測量變項之間具有共線性的影響。

 

近幾年偏最小平方法在軟體工具上快速發展,逐漸擴展到社會科學領域,未來應有非常大的發展空間,特別是在跨學門的方法融合與創新上,在實務上也有高度應用價值。若讀者想深入了解偏最小平方法的議題,可參閱邱皓政教授在《αβγ量化研究學刊》第三卷第一期的專文,或閱讀湯家偉教授翻譯、吳政達教授審訂,由高等教育出版的《結構方程模型:偏最小平方法PLS-SEM》專書。