天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

第十三章多重回歸實習指導(定)

發(fā)布時間:2017-01-21 20:00

  本文關鍵詞:回歸方程,由筆耕文化傳播整理發(fā)布。


第十三章 多重線性回歸與相關

[教學要求]

了解: 多重共線性的概念及其對回歸分析結果的影響;通徑分析的基本過程及其應用。 熟悉:多重相關與回歸分析的基本原理與方法。

掌握:掌握多重相關與回歸分析結果的解釋;相關、回歸、簡單相關、偏相關與復相關,簡單回歸、偏回歸與全回歸等概念。

[重點難點]

第一節(jié) 多重線性回歸的概念及其統(tǒng)計描述

一、變量(Y)關于k個自變量(X1,X2,...,Xk)的多重線性回歸的數(shù)學模型為:

Yi??0??1X1i??2X2i?...??kXki??i。實質是將每個Y的觀測值用該模型在最小殘 差平方和的原則下進行分解。

二、標準回歸系數(shù)為將各個變量按Xi*?Xi?i變換后,再進行多重回歸計算所得的 Si

回歸系數(shù)。因為通過標準化過程消除了各個變量的計量單位不同對回歸系數(shù)的影響, 所以各個標準回歸系數(shù)的大小能直接反映該自變量對Y變量的回歸效應的大小。

三、多重回歸分析的前提條件完全與簡單線性回歸相同:線性、獨立、正態(tài)和等方差,即 LINE。

第二節(jié) 多重線性回歸的假設檢驗

一、 整體回歸效應的假設檢驗(方差分析)的原假設為H0: ?1??2??3?...??k?0;其過程 是通過對Y的總變異進行分解,用回歸均方與殘差均方的比值構造F檢驗統(tǒng)計量,然后根 據(jù)相應的F分布決定是否拒絕原假設。

二、偏回歸系數(shù)的t檢驗的的原假設為H0: βi=0,即第i個總體偏回歸系數(shù)為零;其過程是 用第i個偏回歸系數(shù)的估計bi與該偏回歸系數(shù)的標準誤之比值構造t統(tǒng)計量:

1

tbi?bi

Sbi

然后根據(jù)相應的t分布決定是否拒絕原假設。

第三節(jié) 復相關系數(shù)與偏相關系數(shù)

一、 確定系數(shù)、復相關系數(shù)與調整確定系數(shù)

1、復相關系數(shù)的平方稱為確定系數(shù)(coefficient of determination)或決定系數(shù),記為R 2,用以反映線性回歸模型能在多大程度上解釋反應變量Y的變異性。其定義為

R2?SSR SST

2其取值范圍為0?R2?1。若確定系數(shù)R 的值接近于1,指示樣本數(shù)據(jù)很好地擬合了所選

用的線性回歸模型。R 2直接反映回歸方程中所有自變量解釋反應變量Y總變異的百分比。同時,R 2也可以解釋為回歸方程使反應變量Y的總變異減少的百分比。

2、復相關系數(shù)(multiple correlation coefficient) R, 定義為確定系數(shù)的平方根,即

R?SSR SST

3、調整的R 2(adjusted R-Square):當回歸方程中包含有很多自變量,即使其中有一些自變量對解釋反應變量變異的貢獻極小,隨著回歸方程的自變量的增加,R 2值表現(xiàn)為

2只增不減。調整的R 2克服了這一缺點。調整的R 2記為Ra,定義為 k(1?R2) R?R? n?k?12

a2

二、偏相關系數(shù)和偏回歸系數(shù)

1、偏相關系數(shù)(partial correlation coefficient):扣除其他變量的影響后,變量Y與X的相關的有無、方向與強弱程度,稱為Y與X的偏相關系數(shù)。

2、偏回歸系數(shù)( partial regression coefficient ):當方程中其他自變量保持常量時,自變量Xi變化一個計量單位,反應變量Y的平均值變化的單位數(shù)量。

2

3、簡單相關系數(shù)的假設檢驗與簡單回歸系數(shù)的假設檢驗等價;多重回歸的整體回歸效應的假設檢驗與總體確定系數(shù)R 2=0的假設檢驗等價;偏相關系數(shù)的假設檢驗與偏回歸系數(shù)的假設檢驗等價。

第四節(jié) 自變量篩選

一、 自變量篩選的標準與原則

1、自變量篩選的目的是確保回歸方程包含所有對反應變量有較大影響的自變量,而把與反應變量關系不大或可有可無的自變量排除在方程之外,以提高回歸參數(shù)的估計和預測的精度。

2、殘差平方和(SSE)縮小與確定系數(shù)(R2)增大的自變量篩選原則是等價的;殘差均方(MSE)縮小與調整確定系數(shù)(R

二、 變量篩選的常用方法

自變量篩選的方法很多,有前向選擇、后向選擇、逐步選擇等。但以逐步選擇(stepwise selection)的方法應用較多。在逐步選擇過程中,把經(jīng)F檢驗有意義的變量引入方程后,又對已在方程中的自變量進行一次關于剔除的F檢驗,保留有統(tǒng)計學意義的變量,而剔除無統(tǒng)計學意義的變量。反復進行引入、剔除過程,直到既沒有變量被引入,也沒有變量被剔除為止。

* 第五節(jié) 關于多重線性回歸的應用

一、非同質資料的合并問題:

在用回歸分析解釋實際專業(yè)問題時,應考慮是否存在混雜變量干擾回歸結果,即在該混雜變量的不同水平上的回歸系數(shù)具有不同的特征;不要將這種非同質的資料合并擬合回歸模型,應分組擬合回歸模型。

二、多重共線性(multi-co-linearity)問題:

多重共線性是指自變量之間非獨立或線性相關,即回歸模型中的一個自變量近似為其它自變量的線性組合。多重共線性的存在將導致對回歸參數(shù)?的最小二乘估計的性質變壞。表現(xiàn)為:①回歸參數(shù)估計值的標準誤差偏大,因此回歸參數(shù)估計值變得十分不穩(wěn)定,甚至符號改變;②當樣本數(shù)據(jù)有略微改變或在模型中增加或刪除某個自變量時,將使其它自變 3 2?)增大的自變量篩選的標準與原則也是等價的。

量的回歸參數(shù)估計值發(fā)生較大變化,從而使回歸參數(shù)估計值失去意義。

在實際應用多重線性回歸過程中不難發(fā)現(xiàn),自變量之間相互獨立或線性無關的情況是很少見的,多重共線性現(xiàn)象難以避免,問題在于其多重共線性的強弱程度。許多統(tǒng)計學家認為,如果多重共線性在程度上較弱時,線性回歸仍然不失為解決實際問題的有效工具。但當多重共線性較強時,將會導致一系列錯誤的結論。

三、通徑分析(path analysis)

通徑分析是一種在回歸基礎上拓展,用以處理具有較為復雜變量關系的統(tǒng)計學方法。根據(jù)具體的專業(yè)知識,建立變量間的直接聯(lián)系圖,構造并擬合通徑分析模型,使之更為合理地解釋變量間的數(shù)量關系。通徑分析與一次性多重線性回歸分析相比,能分離出各個變量對反應變量的直接效應與間接效應。

四、自變量間交互作用的回歸模型

生物醫(yī)學研究的問題常常涉及到自變量間乘積項對反應變量作用的情況,統(tǒng)計學為處理此類問題提供了方法,即擬合有交互作用項的回歸模型。

[案例討論參考答案]

案例13-1 (1)由相關分析結果可見:三個自變量(X1,X2,X3)與反應變量Y的相關系數(shù)很。<0.23);而三個自變量間的相關系數(shù)很大(>0.49)。

(2)這些與簡單回歸情況相悖的結果是由于三個自變量的共線性。

[電腦實驗程序及結果解釋]

實驗13-1 多重線性回歸、逐步回歸與全子集回歸

程序13-1 例13-1數(shù)據(jù)的多重線性回歸、逐步回歸與全子集回歸

02 INPUT x1-x4 y;

03 DATALINES;

04 1300 20.0 80 0.45 0.066

05 ……… 06 1436 28.0 68 2.00 0.099

07 ;

08 PROC REG CORR; 數(shù)據(jù)塊結束; 調用REG過程進行回歸分析,要求輸出相關陣CORR; 定義并讀入變量x1-x4和y; 標志數(shù)據(jù)塊開始; 4

09 MODEL y=x1-x4 /PARTIAL STB; 指定回歸模型,要求輸出每個回歸變量的偏回歸

杠桿圖PARTIAL和標準化回歸系數(shù)STB; 10 PROC REG ;

11 MODEL y=x1-x4 /SELECTION=STEPWISE ;

12 PROC REG ;

13 MODEL y=x1-x4 /SELECTION=RSQUARE ;

14 RUN; 調用REG過程; 按指定模型進行逐步回歸分析; 調用REG過程; 按指定模型進行定全子集回歸分析; 運行程序;

運行結果:

Output窗口:

運行結果:

The REG Procedure

Correlation

(相關系數(shù)陣)

Variable x1 x2 x3 x4 y

x1 1.0000 -0.1412 0.3949 -0.5684 0.8080

x2 -0.1412 1.0000 -0.0728 0.3840 0.0172 x3 0.3949 -0.0728 1.0000 -0.1464 0.2785 x4 -0.5684 0.3840 -0.1464 1.0000 -0.6796 y 0.8080 0.0172 0.2785 -0.6796 1.0000

The REG Procedure

Model: MODEL1

Dependent Variable: y

Analysis of Variance

(回歸模型的方差分析表)

Sum of Mean

Source DF Squares Square F Value Pr > F Model 4 0.06396 0.01599 17.59 <.0001 Error 19 0.01727 0.00090903

Corrected Total 23 0.08123

5

Root MSE(誤差均方平方根) 0.03015 R-Square(R) 0.7874

Dependent Mean(反應變量均值) 0.08708 Adj R-Sq(調整R2) 0.7426

Coeff Var(反應變量變異系數(shù)) 34.62214

Parameter Estimates

(參數(shù)估計及有關統(tǒng)計量)

Parameter Standard Standardized Variable DF Estimate Error t Value Pr > |t| Estimate

(回歸系數(shù)參數(shù)估計)(參數(shù)估計的標準誤) (標準化偏回歸系數(shù)) Intercept 1 -0.14166 0.06916 -2.05 0.0546 0 x1 1 0.00011619 0.00002748 4.23 0.0005 0.59249 x2 1 0.00449 0.00190 2.36 0.0289 0.27274 x3 1 -0.00000655 0.00069083 -0.01 0.9925 -0.00110 x4 1 -0.03468 0.01081 -3.21 0.0046 -0.44770 2

The REG Procedure

Model: MODEL1

Partial Regression Residual Plot

(偏回歸殘差散點圖)

y y y

Intercept x1 x2

y y

6

x3 x4

逐步回歸分析結果:

(逐步回歸結果)

(變量x1進入模型)

Analysis of Variance

(模型方差分析)

7

The REG Procedure Model: MODEL1 Dependent Variable: y Stepwise Selection: Step 1 Variable x1 Entered: R-Square = 0.6529 and C(p) = 11.0195 Sum of Mean Source DF Squares Square F Value Pr > F Model 1 0.05303 0.05303 41.38 <.0001 Error 22 0.02820 0.00128 Corrected Total 23 0.08123 Parameter Standard Variable Estimate Error Type II SS F Value Pr > F Intercept -0.13529 0.03534 0.01879 14.66 0.0009 x1 0.00015845 0.00002463 0.05303 41.38 <.0001

Bounds on condition number: 1, 1

----------------------------------------------------------------------------------------------------- Stepwise Selection: Step 2

Variable x4 Entered: R-Square = 0.7246 and C(p) = 6.6117(變量x4進入模型)

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 2 0.05886 0.02943 27.62 <.0001

Error 21 0.02237 0.00107

Corrected Total 23 0.08123

Parameter Standard

Variable Estimate Error Type II SS F Value Pr > F

Intercept -0.05000 0.04867 0.00112 1.06 0.3160

x1 0.00012217 0.00002729 0.02134 20.03 0.0002

x4 -0.02522 0.01078 0.00582 5.47 0.0293

Bounds on condition number: 1.4772, 5.9088

----------------------------------------------------------------------------------------------------- Stepwise Selection: Step 3

Variable x2 Entered: R-Square = 0.7874 and C(p) = 3.0001(變量x2進入模型)

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 3 0.06396 0.02132 24.69 <.0001

Error 20 0.01727 0.00086358

8

Corrected Total 23 0.08123

Parameter Standard

Variable Estimate Error Type II SS F Value Pr > F

Intercept -0.14200 0.05790 0.00519 6.01 0.0235

x1 0.00011608 0.00002470 0.01907 22.08 0.0001

x2 0.00449 0.00185 0.00510 5.91 0.0246

x4 -0.03470 0.01046 0.00950 11.00 0.0034

Bounds on condition number: 1.7157, 13.18

----------------------------------------------------------------------------------------------------- All variables left in the model are significant at the 0.1500 level.

No other variable met the 0.1500 significance level for entry into the model.

(說明:進入模型的變量均在0.15的水平上有統(tǒng)計學意義)

Summary of Stepwise Selection

(逐步選擇匯總)

Variable Variable Number Partial Model

Step Entered Removed Vars In R-Square R-Square C(p) F Value Pr > F

(入選變量)(剔除變量)(模型中變量個數(shù)) (偏R ) (模型R)

1 x1 1 0.6529 0.6529 11.0195 41.38 <.0001 2 x4 2 0.0717 0.7246 6.6117 5.47 0.0293 3 x2 3 0.0628 0.7874 3.0001 5.91 0.0246 22

全子集回歸分析結果:

The REG Procedure

Model: MODEL1

Dependent Variable: y

R-Square Selection Method

(R選擇法)

9 2

Number in

Model R-Square Variables in Model 1 0.6529 x1

1 0.4618 x4

1 0.0776 x3

1 0.0003 x2

------------------------------------------- 2 0.7246 x1 x4

2 0.6705 x1 x2

2 0.6548 x1 x3

2 0.5526 x2 x4

2 0.4946 x3 x4

2 0.0790 x2 x3

------------------------------------------- 3 0.7874 x1 x2 x4 3 0.7248 x1 x3 x4 3 0.6722 x1 x2 x3 3 0.5874 x2 x3 x4

-------------------------------------------

4 0.7874 x1 x2 x3 x4

實驗13-2 具有交互項的回歸模型

程序13-2 例13-6數(shù)據(jù)具有交互項的回歸

02 INPUT x1 x2 y @@; 定義并連續(xù)讀入變量x1、x2和y; 03 DATALINES; 標志數(shù)據(jù)塊開始;

04 1 2 43 1 4 41 1 6 37 05 ………

06 4 7 32

07 ; 數(shù)據(jù)塊結束;

10

08

09 PROC GLM ; MODEL y=x1 x2 x1*x2; 調用GLM過程; 指定具有交互項的多重線性回歸模型; 10 RUN; 運行程序;

運行結果:

Output窗口:

The GLM Procedure

Dependent Variable: y

Sum of

Source DF Squares Mean Square F Value Pr > F Model 3 190.2598000 63.4199333 277.73 <.0001 Error 12 2.7402000 0.2283500

Corrected Total 15 193.0000000

R-Square Coeff Var Root MSE y Mean

0.985802 1.318234 0.477860 36.25000

Source DF Type I SS Mean Square F Value Pr > F x1 1 36.4500000 36.4500000 159.62 <.0001 x2 1 149.5269044 149.5269044 654.81 <.0001 x1*x2 1 4.2828956 4.2828956 18.76 0.0010

Source DF Type III SS Mean Square F Value Pr > F x1 1 19.95884020 19.95884020 87.40 <.0001 x2 1 47.84922385 47.84922385 209.54 <.0001 x1*x2 1 4.28289559 4.28289559 18.76 0.0010

Standard

Parameter Estimate Error t Value Pr > |t| Intercept 49.47549992 0.72648054 68.10 <.0001 x1 -2.53529995 0.27118284 -9.35 <.0001 11

x2 -1.94362693 0.13426906 -14.48 <.0001

x1*x2 0.22117616 0.05107050 4.33 0.0010

實驗13-3 偏相關系數(shù)的計算

程序13-3 例13-1數(shù)據(jù)偏相關系數(shù)的計算

02 INPUT x1-x4 y; 03 DATALINES; 04 1300 20.0 80 0.45

05 ……… 06 1436 28.0 68 2.00

07 ;

08 PROC CORR;

09 10 VAR y x1; PARTIAL x2-x4; 定義并讀入變量x1-x4和y; 標志數(shù)據(jù)塊開始; 0.066 0.099 數(shù)據(jù)塊結束; 調用CORR過程進行偏相關分析; 指定計算相關系數(shù)的變量y和x1; 指定要扣除其影響的變量x2-x4; 調用REG過程進行回歸分析;

指定回歸模型,要求輸出各自變量偏相關系數(shù)的平方;

運行程序; 11 PROC REG; 12 MODEL y=x1-x4/PCORR2; 13 RUN;

運行結果:

Output窗口:

偏相關分析結果:

The CORR Procedure

3 Partial Variables: X2 X3 X4

2 Variables: Y X1

Simple Statistics

Variable N Mean Std Dev Sum Minimum Maximum X2 24 25.24583 3.60687 605.90000 20.00000 35.00000 X3 24 71.08333 9.97787 1706 57.00000 92.00000 X4 24 1.36375 0.76708 32.73000 0.40000 3.00000 Y 24 0.08708 0.05943 2.09000 0.00100 0.22200 X1 24 1404 303.05818 33684 786.00000 1844 12

Simple Statistics

Partial Partial

Variable Variance Std Dev

(偏方差) (偏標準差) X2

X3

X4

Y 0.00168 0.04094

X1 60174 245.30410

Pearson Partial Correlation Coefficients, N = 24

Prob > |r| under H0: Partial Rho=0

(偏相關系數(shù)陣)

Y X1

Y 1.00000 0.69620

0.0005

X1 0.69620 1.00000 0.0005

REG過程輸出結果:

The REG Procedure

Model: MODEL1

Dependent Variable: Y

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F Model 4 0.06396 0.01599 17.59 <.0001 Error 19 0.01727 0.00090903

Corrected Total 23 0.08123

13

Root MSE 0.03015 R-Square 0.7874

Dependent Mean 0.08708 Adj R-Sq 0.7426

Coeff Var 34.62214

Parameter Estimates

Parameter Standard Squared Partial Variable DF Estimate Error t Value Pr > |t| Corr Type II

Intercept 1 -0.14166 0.06916 -2.05 0.0546 (偏相關系數(shù)平方) X1 1 0.00011619 0.00002748 4.23 0.0005 0.48470 X2 1 0.00449 0.00190 2.36 0.0289 0.22724 X3 1 -0.00000655 0.00069083 -0.01 0.9925 0.00000473 X4 1 -0.03468 0.01081 -3.21 0.0046 0.35135

實驗13-4 自變量共線性對回歸結果的影響

程序13-4 共線性自變量對回歸結果的影響

02 INPUT x1 x2 x3; 定義并讀入變量x1、x2和x3;

03 Y=10+2*x1+3*x2+1.5*x3+RANNOR(0); 從正態(tài)總體N(10+2X1+3X2+1.5X3 ,12)中隨機抽取相應的Y; 04 OUTPUT; 05 CARDS;

06 1.1 1.1 1.7

07 1.4 1.5 1.5

08 1.7 1.8 2.8

09 1.7 1.7 1.7

10 1.8 1.9 1.9

11 1.8 1.8 1.8

12 1.9 1.8 3.8

13 2.0 2.1 2.1

14 2.3 2.4 1.4

15 2.4 2.5 1.5

寫入實據(jù)集; 標志數(shù)據(jù)塊開始; 14

16 ;

17 PROC REG CORR; 數(shù)據(jù)塊結束; 調用REG過程進行回歸分析,要求輸出相關陣CORR; 18 MODEL y=x1 x2 x3; 指定回歸模型; 19 RUN; 運行程序;

運行結果:

Output窗口:

The REG Procedure

Correlation

Variable x1 x2 x3 Y x1 1.0000 0.9860 -0.0163 0.8241 x2 0.9860 1.0000 -0.1140 0.7703 x3 -0.0163 -0.1140 1.0000 0.4700 Y 0.8241 0.7703 0.4700 1.0000

The REG Procedure

Model: MODEL1

Dependent Variable: Y

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F Model 3 43.31511 14.43837 21.34 0.0013 Error 6 4.05896 0.67649

Corrected Total 9 47.37407

Root MSE 0.82249 R-Square 0.9143

Dependent Mean 22.37411 Adj R-Sq 0.8715

Coeff Var 3.67609

Parameter Estimates

Parameter Standard

15

Variable DF Estimate Error t Value Pr > |t| Intercept 1 10.25225 1.56682 6.54 0.0006 x1 1 3.29160 5.25317 0.63 0.5540 x2 1 1.59999 4.96987 0.32 0.7584

x3 1 1.57825 0.45568 3.46 0.0134

分析:從相關系數(shù)陣可以觀察到變量x1與x2之間具有較強的相關性(r=0.9860),而變量x3則與x1、x2獨立。從回歸分析的結果可以發(fā)現(xiàn)自變量x1與x2的回歸系數(shù)估計值與原總體關系差別很大,而x2的回歸系數(shù)估計值則相近。進一步重復該實驗,可以觀察到x1與x2的回歸系數(shù)估計值變化很大,甚至發(fā)生符號的改變。

[思考與練習的參考答案]

k(1?R2)

1. R?R?=0.44-[12(1-0.44)]/[50-12-1]=0.2584

n?k?1

2a

2

2. 在多重回歸分析中,將某一自變量的值都乘以10,該自變量的偏回歸系數(shù)變?yōu)樵貧w系數(shù)數(shù)值的1/10倍,標準化偏回歸系數(shù)不變。

3. X1、X2、X3、X4對Y的多重線性回歸

檢驗回歸方程整體意義的方差分析表

變異來源 回歸模型 殘差 總變異

自由度 4 12 16

SS 2950.6417 2106.7360 5057.3776

MS 737.6604 175.5613

F 4.20

P 0.0235

偏回歸系數(shù)及其檢驗結果

變量 截距 X1 X2 X3 X4

自由度 1 1 1 1 1

回歸系數(shù) 23.4237 0.4753 1.1930 -0.8136 0.6305

標準誤 35.3449 0.7139 0.3979 0.5006 0.4309

t值 0.66 0.67 3.00 -1.63 1.46

P值 0.5200 0.5182 0.0111 0.1300 0.1691

標準偏回歸系數(shù) 0 0.1696 1.0737 -0.3715 0.5603

可列出回歸方程

16

??23.4237?0.4753X?1.1930X?0.8136X?0.6305X Y1234

總體模型有意義,說明從整體上而言,用這四個自變量構成的回歸方程解釋因變量有統(tǒng)計學意義。但這四個變量中,只有變量X2的偏回歸系數(shù)在0.05的概率水平下具有統(tǒng)計學意義。原則上應考慮回歸方程的實際意義,建立不包含無統(tǒng)計學意義自變量的回歸方程。

4.分別以簡單線性、二次與三次多項式擬合的回歸模型結果如下表所示:

擬合不同模型的結果

模型 簡單線性

回歸方程

??10.2359?0.0345x Y

MSE

F值 P值

R2

0.2607 4.20 0.0795 0.3751

??10.4197?0.0013二次函數(shù) Yx2 0.2429 5.91 0.0453 0.4579

??10.4816?0.00006三次函數(shù) Yx3 0.2279 7.68 0.0277 0.5230

可見,在以上的三種模型中,以三次多項式模型為優(yōu)。 5. Y 關于X1、X2、X3、X4、X5、X6的線性回歸:

檢驗回歸方程整體意義的方差分析表

變異來源 回歸模型 殘差 總變異

自由度 6 4 10

SS 1047.0611 421.1207 1468.1818

MS 174.5102 105.2802

F 1.66

P 0.3252

偏回歸系數(shù)及其檢驗結果

變量 截距 X1 X2 X3 X4 X5 X6

自由度 1 1 1 1 1 1 1

回歸系數(shù) 18.30200 -3.51820 0.91368 1.22379 0.76802 -1.00394 1.14764

標準誤 17.53866 3.22788 9.22769 1.38695 3.42170 2.34739 1.18261

t值 1.04 -1.09 0.10 0.88 0.22 -0.43 0.97

P值 0.3556 0.3370 0.9259 0.4274 0.8334 0.6909 0.3868

歸系數(shù) 0 -1.13809 0.21688 0.65356 0.21740 -0.63994 1.09215

總體模型無統(tǒng)計學意義,說明從整體上而言,不能用這六個自變量構成的回歸方程解釋因變量。這六個變量的偏回歸系數(shù)在0.05的概率水平下均與0無統(tǒng)計學差異。

17

通過相關分析,其結果如下表所示:

各變量的簡單相關系數(shù)

Variable

X1

1.0000 0.8346 0.8401 0.8676 0.3246 0.5346 0.1568

X2

0.8346 1.0000 0.7400 0.8017 0.6580 0.4586 0.0047

X3

0.8401 0.7400 1.0000 0.7168 0.2065 0.4209 0.3413

X4

0.8676 0.8017 0.7168 1.0000 0.3747 0.6084 0.2971

X5

0.3246 0.6580 0.2065 0.3747 1.0000 0.6403 0.0491

X6

0.5346 0.4586 0.4209 0.6084 0.6403 1.0000 0.5808

X6

0.1568 0.0047 0.3413 0.2971 0.0491 0.5808 1.0000

X1 X2 X3 X4 X5 X6 X6

結果顯示:(1)自變量中存在著較強的相關,說明存在自變量共線的情況;(2)除X6以外,其它自變量和因變量的相關都較弱。

此外,相對于變量數(shù)目而言,這個問題的樣本量過小。

[補充練習題]

一、選擇題

(一)A1型:每一道題下面有A、B、C、D、E五個備選答案,請從中選擇一個最佳答案。

1. 逐步回歸分析中,若增加引入的自變量,則__________。

A.回歸平方和與殘差平方和均增大 B. 回歸平方和與殘差平方和均減少 C.總平方和與回歸平方和均增大 D. 回歸平方和增大,殘差平方和減少 E. 總平方和與回歸平方和均減少

2. 多重線性回歸分析中,若對某一自變量的值乘以一個不為零的常數(shù)K, 則有__________。 A. 該偏回歸系數(shù)值不變 B. 該偏回歸系數(shù)值為原有偏回歸系數(shù)值的1/K倍 C. 該偏回歸系數(shù)值會改變,但無規(guī)律 D. 所有偏回歸系數(shù)值均會改變 E. 所有偏回歸系數(shù)值均不會改變

3. 多重線性回歸分析中,若對某一自變量的值加上一個不為零的常數(shù)K,則有__________。 A. 截距和該偏回歸系數(shù)值均不變 B.該偏回歸系數(shù)值為原有偏回歸系數(shù)值的K倍

18

C. 該偏回歸系數(shù)值會改變,但無規(guī)律 D.截距改變,但所有偏回歸系數(shù)值均不改變 E. 所有偏回歸系數(shù)值均不會改變

4. 多重線性回歸分析中,能直接反映自變量解釋因變量變異數(shù)量的指標為 __________。

A. 復相關系數(shù) B. 簡單相關系數(shù) C. 確定性系數(shù)

D. 偏回歸系數(shù) E. 偏相關系數(shù)

5. 多重線性回歸分析中的共線性是指__________。

A. Y關于各個自變量的回歸系數(shù)相同 B.Y關于各個自變量的回歸系數(shù)與截距都相同

C. Y變量與各個自變量的相關系數(shù)相同 D.Y與自變量間有較高的復相關

E. 自變量間有較高的相關性

(二)A2型:每一道題以一個小案例出現(xiàn),其下面都有A、B、C、D、E五個備選答案,,請從中選擇一個最佳答案。

由具有X1、 X2 、X3三個變量的樣本數(shù)據(jù)計算,獲得這三個變量的簡單相關系數(shù)如下:

變量

X1

X2

X3

1. 扣除X1的影響后,X2與X3的偏相關系數(shù)為__________。

A. 0.93941 B. 0.88403 C. 0.84897

D. 0.47749 E. 0.76472

2. 扣除X2的影響后,X1與X3的偏相關系數(shù)為_________。

A. 0.11551 B. 0.88403 C. 0.84897

D. 0.47749 E. 0.76472

19 X1 1.00000 0.84897 0.93941 X2 0.84897 1.00000 0.88403 X3 0.93941 0.88403 1.00000

3. 扣除X3的影響后,X1與X2的偏相關系數(shù)為_________。

A. 0.11551 B. 0.88403 C. 0.84897 D. 0.47749 E. 0.76472

(三)A3/A4型:以下提供若干案例,每個案例下設若干道題目。請根據(jù)題目所提供的信息,在每一道題下面的A、B、C、D、E五個備選答案中選擇一個最佳答案。 (第1~3題共用題干)

為了探討大學生肺活量與身高、體重的關系,獲得下表數(shù)據(jù):

身高 (cm) X1 135.1 139.9 163.6 156.2 167.8 165.5 155.1 149.4

1. 若將上表中以厘米為單位的身高數(shù)據(jù)替換為以米為計量單位,以肺活量為反應變量, 身高、體重為自變量,擬合所得的線性回歸方程與原表數(shù)據(jù)所得的方程相比_________。 A. 截距與兩個偏回歸系數(shù)不會改變

B. 截距會改變,而兩個偏回歸系數(shù)不會改變

C. 截距與體重的偏回歸系數(shù)不會改變,身高的偏回歸系數(shù)改變 D. 截距與身高的偏回歸系數(shù)不會改變,體重的偏回歸系數(shù)改變 E. 截距不會改變,身高與體重的偏回歸系數(shù)均會改變

2. 若將上表中以公斤為單位的體重數(shù)據(jù)替換為以市斤為計量單位,以肺活量為反應變量, 身高、體重為自變量,擬合所得的線性回歸方程與原表數(shù)據(jù)所得的方程相比_________。

20

體重 (kg) X2 32.0 30.4 46.2 37.1 41.5 49.5 44.7 33.9

肺活量 (L)

Y 1.75 2.00 2.75 2.75 2.75 3.00 2.75 2.25

A. 截距與兩個偏回歸系數(shù)不會改變

B. 截距會改變,而兩個偏回歸系數(shù)不會改變

C. 截距與體重的偏回歸系數(shù)不會改變,身高的偏回歸系數(shù)改變

D. 截距與身高的偏回歸系數(shù)不會改變,體重的偏回歸系數(shù)改變

E. 截距不會改變,身高與體重的偏回歸系數(shù)均會改變

3. 若將上表中以升為單位的肺活量數(shù)據(jù)替換為以毫升為計量單位,以肺活量為反應變量, 身高、體重為自變量,擬合所得的線性回歸方程與原表數(shù)據(jù)所得的方程相比_________。

A. 截距與兩個偏回歸系數(shù)不會改變

B. 截距會改變,而兩個偏回歸系數(shù)不會改變

C. 截距與體重的偏回歸系數(shù)不會改變,身高的偏回歸系數(shù)改變

D. 截距與身高的偏回歸系數(shù)不會改變,體重的偏回歸系數(shù)改變

E. 截距、身高與體重的偏回歸系數(shù)均會改變

(四)B1型:以下提供若干組題目,每組題目共用題目前列出的A、B、C、D、E五個備選答案。請從中選擇一個與問題關系最密切的答案。某個備選答案可能被選擇一次、多次或不被選擇。

A. 截距不變,但變量Xi的偏回歸系數(shù)是原偏回歸系數(shù)的1/k倍

B. 截距不變,且每個偏回歸系數(shù)為原偏回歸系數(shù)的1/k倍

C. 截距改變,而各個偏回歸系數(shù)不變

D. 截距和每個偏回歸系數(shù)都擴大到原數(shù)值的k倍

E. 截距擴大到原數(shù)值的k倍,而各個偏回歸系數(shù)不變

1. 自變量Xi的值擴大到原數(shù)值的k倍,會使線性回歸方程的__________。

2. 自變量Xi的值加上非零的常數(shù)k ,會使線性回歸方程的__________。

3. 反應變量Y的值擴大到原數(shù)值的k倍,會使線性回歸方程的__________。

4. 所有自變量的值同時擴大到原數(shù)值的k倍,會使線性回歸方程的__________。

5. 所有自變量和反應變量Y的值都同時擴大到原數(shù)值的k倍,會使線性回歸方程的 __________。

21

二、是非題

1. 整體回歸效應的假設檢驗在?水平下拒絕H0,表示引入回歸方程中的每一個自變量都在?水平下有效地解釋了因變量Y的變異。 ( )

2. 改變某一自變量的某一個數(shù)值,只會使該自變量的偏回歸系數(shù)值改變。 ( )

3. 改變因變量Y的某一個數(shù)值,將會導致回歸方程的所有偏回歸系數(shù)值改變。 ( )

4. 在具有k個自變量的多重回歸模型基礎上,減少一個自變量,會導致回歸平方和的減少。 ( )

5. 用同一樣本數(shù)據(jù),無論擬合的多重線性回歸模型包含的自變量有多少,其總變異(SST)是不變的。 ( )

6. 若有X1 、X2、 X3三個變量的數(shù)據(jù),X2、X3的偏相關系數(shù)(r2,31)是X3關于X1線性回歸的殘差與X2的簡單相關系數(shù)。 ( )

7. 逐步回歸選擇變量的方法一般情況下與全回歸法、前向性和后向性法所獲得的結果相同。 ( )

8. 多重共線性是指Y關于各個自變量的回歸直線呈重疊狀態(tài)。 ( )

9. 在n 個樣本含量的基礎上增加一個觀測數(shù)據(jù)后所得的線性回歸方程與n個數(shù)據(jù)所得的回歸方程相比,除截距相同外,各個偏回歸系數(shù)均有改變。 ( )

[參考答案]

一、選擇題

(一) 1.D 2.B 3.D 4.C 5.E

(二) 1.D 2.E 3.A

(三) 1.C 2.D 3.E

(四) 1. A 2.C 3.D 4.B 5. E

二、是非題

1.× 2.× 3. ? 4. ? 5. ?

6.? 7.× 8. × 9. ×

(葉鷹 董時富)

22


  本文關鍵詞:回歸方程,由筆耕文化傳播整理發(fā)布。



本文編號:239481

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/touziyanjiulunwen/239481.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶3ed18***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com