多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性
产生原因
1、经济变量相关的共同趋势
2、滞后变量的引入
3、样本资料的限制
扩展资料
影响
1、完全共线性下参数估计量不存在
2、近似共线性下OLS估计量非有效
多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)如果方差膨胀因子值越大,说明共线性越强。相反 因为,容许度是方差膨胀因子的倒数,所以,容许度越小,共线性越强。
解决方法
1、排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除出去,以逐步回归法得到最广泛的应用。
2、差分法
时间序列数据、线性模型:将原模型变换为差分模型。
3、减小参数估计量的方差:岭回归法(Ridge Regression)。
参考资料来源:百度百科——多重共线性