相關分析法
相關分析法
method of correlation analysis
?? 用于研究社會經濟現象數量依存關系的一種數理統計方法。包括相關分析與回歸分析。相關分析是對兩個對等的經濟數列,用數學方法測定一個反映它們之間變動的聯系程度和聯系方向的抽象化數值,即相關系數。回歸分析是在兩個或兩個以上有聯系的經濟數列中,確定一個為因變量數列,其他為自變量數列,為它們配合一定的數學模型(見經濟計量分析),并用統計方法(如常用的最小平方法)估計模型參數,得出回歸方程,作為根據自變量值估計因變量值的依據。一個因變量與一個自變量回歸,稱單回歸;一個因變量與兩個或兩個以上自變量回歸,稱復回歸。回歸的表現形式有直線回歸與非直線回歸。回歸估計是以給定的自變量值代入回歸方程中求得估計的因變量平均值。這個平均值有誤差,誤差的代表值是估計標準誤差。相關系數、回歸方程和估計標準誤差是相關分析法三個有密切聯系的主要組成部分。最簡單、最基本的相關分析法是兩變量之間的直線相關和回歸。
直線相關系數計算方法設和
為兩個不分因變量和自變量的對等變量,
代表成對變量值數目,則相關系數
的算式為:
???????? [1076-01]
值在+1與-1之間,其值越接近±1,表示兩變量直線相關的程度越高,越接近零,則相關程度越低;正號
值表示兩變量有同增同減的同方向變動關系,而負號
值則表示一增一減的異方向變動關系。
直線回歸分析方法直線回歸的一般方程式是=
+
,式中的
是自變量,
是因變量,稱
倚
回歸方程。在兩變量互為因果關系(如身高與體重)的資料中,還可計算另一條對應的回歸線:
倚
回歸線,即
=
+
。在
倚
回歸方程中,只能根據給定的
值估計平均的
值,而不能反過來給定
值估計
值;同樣,在
倚
回歸方程中,也只能根據給定的
值估計平均的
值,而不能反過來估計。在不是互為因果關系的資料(如每畝耕地施肥量與農作物產量資料)中,則只能計算一條回歸線,進行單方向的估計。在
倚
回歸方程中,用最小平方法估計參數
和
的公式是:
??????????????[1076-03]
?? 直線斜率 如為正值,表明兩變量有正比變動關系;如為負值,則表明有反比變動關系。
是直線的截距。這條回歸線的估計標準誤差算式是:
??????????????[1076-04]
倚
回歸線的
、
及
算式同上,只是把
與
互換即可。
應用相關分析與回歸分析要注意兩個問題:①在資料上,相關分析要求兩個變量都必須是隨機的;而回歸分析則要求因變量必須是隨機的,自變量則不能是隨機的,而是規定的值,這與在回歸方程中用給定的自變量值來估計平均的因變量值是一致的。②防止虛假相關和虛假回歸。在對兩個時間數列進行相關分析和回歸分析時,常因各期指標值受時間因素的強烈影響而損傷了所需要的隨機性;也有時兩個時間數列表面上似有同升同降的變動,實際上并無本質聯系。對這類資料求出的高度相關系數或回歸聯系,往往是一種假象。為此,在用相關分析法研究復雜的社會經濟現象時,需要有科學的理論指導和正確的判斷。