spss回归中共线性诊断怎么解释结果

如题所述

一般以容忍度、方差膨胀因子(VIF,容忍度的倒数)作为共线性诊断指标。一般来说,容忍度的值介于0和1之间,如值太小,说明这个自变量与其它自变量间存在共线性问题;VIF值越大,则共线性问题越明显,一般以小于10为判断依据。操作如下:

1、单击“打开数据文档 ”,将xls格式的全国各地区能源消耗量与产量的数据导入SPSS中。

2、导入过程中,各个字段的值都被转化为字符串型(String),我们需要手动将相应的字段转回数值型。单击菜单栏的“ ”-->“ ”将所选的变量改为数值型。

3、数据清理包括缺失值的填写和还需要使用SPSS分析工具来检查各个变量的数据完整性。单击“ ”-->“ ”,将检查所输入的数据的缺失值个数以及百分比等。

4、SPSS提供了填充缺失值的工具,点击菜单栏“ ”-->“ ”,即可以使用软件提供的几种填充缺失值工具,包括序列均值,临近点中值,临近点中位数等。结合本次实习数据的具体情况,我们不使用SPSS软件提供的替换缺失值工具,主要是手动将缺失值用零值来代替。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-08-25

多重共线性是指线性回归模型中的解释变量之间由于存在较精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

多重共线性诊断方法 
  

1、自变量相关系数矩阵R诊断法:

研究变量的两两相关分析,如果自变量间的相关系数值很大,则认为存在多重共线性。但无确定的标准判断相关系数的大小与共线性的关系。有时,相关系数值不大,也不能排除多重共线性的可能。

2、方差膨胀因子(the variance inflation factor,VIF)诊断法:

方差膨胀因子表达式为:VIFi=1/(1-R2i)。其中Ri为自变量xi对其余自变量作回归分析的复相关系数。当VIFi很大时,表明自变量间存在多重共线性。该诊断方法也存在临界值不易确定的问题,在应用时须慎重。

判断:VIFj>10时,说明自变量x与其余自变量之间存在严重的多重共线关系,这种多重共线性可能会过度地影响最小二乘估计值。
  

3、容忍值(Tolerance,简记为Tol)法:

容忍值是VIF的倒数,即Tol=1/VIF。其取值在0~1之间,Tol越接近1,说明自变量间的共线性越弱。

4、多元决定系数值诊断法:

假定多元回归模型p个自变量,其多元决定系数为R2y(X1,X2,…,Xp),分别构成不含其中某个自变量(Xi,i=1,2,…,p)的p个回归模型,并应用最小二乘法准则拟合回归方程,求出它们各自的决定系数R2i(i=1,2,…,p)。

如果其中较大的一个R2k与R2y很接近,就表明该自变量在模型中对多元决定系数的影响不大,说明该变量对Y总变异的解释能力可由其他自变量代替。很有可能是其他自变量的线性组合。因此,该自变量进入模型后就有可能引起多重共线性问题。

5、条件数与特征分析法:

在自变量的观测值构成的设计矩阵X中,求出变量相关系数R的特征值,如果某个特征值很小(如小于0.05 ),或所有特征值的倒数之和为自变量数目的5倍以上,表明自变量间存在多重共线性关系。

参考资料:

百度百科——共线性

本回答被网友采纳
第2个回答  2019-08-15

首先对所有变量进行标准化处理。

(1) 相关系数。通过做自变量间的散点图观察或者计算相关系数判断,看是否有一些自变量间的相关系数很高。一般来说,2个自变量的相关系数超过0.9,对模型的影响很大,将会出现共线性引起的问题。这只能做初步的判断,并不全面。

(2) 容忍度。以每个自变量作为因变量对其他自变量进行回归分析时得到的残差比例,大小用1减去决定系数来表示。该指标值越小,则说明被其他自变量预测的精度越高,共线性可能越严重。

(3) 方差膨胀因子(VIF)。方差膨胀因子是容忍度的倒数,VIF越大,显示共线性越严重。VIF>10时,提示有严重的多重共线性存在。

(4) 特征根。实际上是对自变量进行主成分分析,如果特征根为0,则提示有严重的共线性。

(5) 条件指数。当某些维度的该指标大于30时,则提示存在共线性。

扩展资料:

自变量筛选常用方法:

(1) 前进法。事先定一个选人自变量的标准。开始时,方程中只含常数项,按自变量对y的贡献大小由大到小依次选入方程。

每选入一个自变量,则要重新计算方程外各自变量(剔除已选人变量的影响后) 对y的贡献,直到方程外变量均达不到选入标准为止。变量一旦进人模型,就不会被剔除。

(2) 后退法。事先定一个剔除自变量的标准。开始时,方程中包含全部自变量,按自变量y对的贡献大小由小到大依次剔除。

每剔除一个变量,则重新计算未被剔除的各变量对y的贡献大小,直到方程中所有变量均不符合剔除标准,没有变量可被剔除为止。自变量一旦被剔除,则不考虑进入模型。

(3) 逐步回归法。本法区别于前进法的根本之处是每引人一个自变量,都会对已在方程中的变量进行检验,对符合剔除标准的变量要逐一剔除。

本回答被网友采纳
第3个回答  推荐于2016-06-10
一般以容忍度、方差膨胀因子(VIF,容忍度的倒数)作为共线性诊断指标。一般来说,容忍度的值介于0和1之间,如值太小,说明这个自变量与其它自变量间存在共线性问题;VIF值越大,则共线性问题越明显,一般以小于10为判断依据(Neter et al.,1985)。DW值用来检验回归分析中的残差项是否存在自相关现象,DW值的取值介于0和4之间:残差一阶正相关时,DW≈0;残差一阶负相关时,DW≈4;残差独立时,DW≈2。分析结果(如表5.3与表5.4)显示,各变量的VIF都远小于10,DW值也符合要求,说明各个自变量之间不存在共线性问题。本回答被网友采纳
第4个回答  2019-12-23
还是颇哎,ss回归中共线性诊断怎么解释结果就是他应该走正规的医学道路。
相似回答