当前位置：文档库 › spss多元线性回归分析92134

spss多元线性回归分析92134

SPSS多元线性回归分析试验

在科学研究中，我们会发现某些指标通常受到多个因素的影响，如血压值除了受年龄影响之外，还受到性别、体重、饮食习惯、吸烟情况等因素的影响，用方程定量描述一个因变量y与多个自变量x1、x2、x3.......之间的线性依存关系，称为多元线性回归。

有学者认为血清中低密度脂蛋白增高是引起动脉硬化的一个重要原因。现测量30名怀疑患有动脉硬化的就诊患者的载脂蛋白A、载脂蛋白B、载脂蛋白E、载脂蛋白Ｃ、低密度脂蛋白中的胆固醇含量。资料如下表所示。求低密度脂蛋白中的胆固醇含量对载脂蛋白Ａ、载脂蛋白Ｂ、载脂蛋白Ｅ、载脂蛋白Ｃ的线性回归方程。

表1 30名就诊患者资料表

221101499.524.7184 2316086 5.310.8118 241121238.016.6127 251471108.518.4137 26204122 6.121.0126 27131102 6.613.4130 281701278.424.7135 291731238.719.0188 3013213113.829.2122

spss数据处理步骤：

（１）打开spss输入数据后，点击“分析”－“回归”－“线性”。然后将“低密度脂蛋白”选入因变量框，将“载脂蛋白Ａ”“载脂蛋白Ｂ”“载脂蛋白Ｅ”“载脂蛋白C”依次选入自变量框。方法选为“逐步”。

（2）单击“统计量”选项，原有选项基础上选择“R方变化”。在残差中选“Durbin-Watson”，单击“继续”。

（3）单击“绘制”，将“DEPENDNT”选入“X2”中，将“*SRESID”选入“Y”中，在标准残差图选项中选择“直方图”和“正态概率图”。单击“继续”。

（4）单击“选项”，在原有选项的基础上单击“继续”，最后单击“确定”，就完

成了。

数据处理结果如下：

输入／移去的变量a

模型输入的变量移去的变量方法

1载脂蛋白B.步进（准则: F-to-enter 的概率

<= .050，F-to-remove 的概

率>= .100）。

2载脂蛋白C.步进（准则: F-to-enter 的概率

<= .050，F-to-remove 的概

率>= .100）。

a. 因变量: 低密度脂蛋白

上图为统计的基本信息。

模型汇总c

模型R R 方调整R 方标准估计的误

差

更改统计量

Durbin-Watson R 方更改 F 更改df1df2Sig. F 更改

1.562a.316.29128.331.3161

2.924128.001

2.733b.538.5032

3.715.22212.960127.001 2.532

a. 预测变量: (常量), 载脂蛋白B。

b. 预测变量: (常量), 载脂蛋白B, 载脂蛋白C。

c. 因变量: 低密度脂蛋白

上图列出了模型的R、R方、调整R方。R方值越大所反映的两变量的共变量比率越高，模型与数据的拟合程度越好。结果显示：自变量和因变量之间的相关系数为0.733，拟合线性回归的确定性系数为0.538，经调整后的确定性系数为0.503。

上图是对拟合的两个模型的方差分析检验结果，两个SIG都小于0.05，说明两个模型都有统计学意义，模型有统计学意义不等于模型内所有的变量都有统计学意义，还需要进一步对各自变量进行检验。

上图为对两个模型中各个系数检验的结果，蛋白B、C其后的SIG都小于0.05，

均有统计学意义。所以最后的回归方程为y=41.841+1.254x2-2.341x4

其后的标准系数可以用来比较自变量对因变量的影响强度，标准系数的绝对值越大说明说明对因变量的贡献越大，本例中B对因变量的影响最大，其次是Ｃ。

上表为残差的直方图，可见残差分布比较均匀，近似服从正态分布，符合多元回归的条件。

上图为残差的正态pp图，可见残差基本呈直线趋势，可以认为因变量呈正态分

上图为低密度脂蛋白胆固醇对学生化残差的散点图，可见残差围绕均线均匀分布，把部分残差绝对值在2以内，提示方差齐。