计量经济学·第一篇 横截面数据的回归分析

如题所述

第一篇:探索横截面数据的回归分析之旅


在计量经济学的第二章中,我们踏入了简单回归模型的世界,那里是非随机变量与随机变量之间关系的神秘领域。我们先从简单的线性回归说起,它犹如一把解开函数关系的钥匙,无论是研究诸如π与半径平方的数学规律(S = πr²),还是关注产量如何受温度、降水、日照和肥料等变量的影响(产量=f(温度,降水,日照,肥料)),回归分析都为我们揭示了潜在的因果联系。


相关分析与回归分析如同两面镜子,前者展示了所有统计关系的概貌,后者则强调因果关系的重要性。简单线性回归模型正是这种双变量的精妙构造,它探讨了解释变量与随机误差项之间微妙的联系。其中,误差项u的关键假设是条件期望为零,这个假定帮助我们理解β1的深层含义——它描绘了在给定x的情况下,y的期望值如何随x变化,而u则是观察值与期望值之间的偏差,围绕着E(y|x)的中心分布。


通过样本回归,我们试图从有限的数据中推测总体的参数,运用普通最小二乘法(OLS)来估计。OLS基于零条件均值假定和x与u不相关的假设,计算斜率参数的公式背后,是矩估计和一阶条件的巧妙结合。相关系数如同信号灯,指示着正负相关性的强度。尽管R2(判定系数)看似完美,它衡量的是y被x解释的百分比,但并非越大越好。低R2可能揭示出隐藏的解释力,关键在于理解模型的适用场景。


当样本数据庞大或变量众多时,过度拟合的风险也随之而来。例如,在教育-工资模型中,每增加一年教育年限,工资大约上涨0.31美元,然而,教育回报的递增性意味着增长百分比保持稳定。对数回归,如CEO薪水与销售额的关系,其弹性不受度量单位影响,这正是OLS估计的精妙之处。然而,无偏估计的前提——随机抽样、解释变量独立于随机误差等假设,至关重要。当这些假定不成立时,OLS估计可能产生偏差,标准误SER虽非无偏但是一致的,其变化性反映了随机性。


回归分析的精度选择需要权衡,我们关注的是估计的可靠性和稳定性。在误差同方差的假设下,OLS估计的方差由可观测和不可观测部分组成,误差方差大时,估计变得复杂。好在,我们可以利用残差来估计误差方差,定理2.3为我们提供了σ2的无偏估计。尽管OLS的标准误SER并非无偏,但其一致性使其在统计实践中依然重要。这一切都建立在高斯-马尔科夫假定的基础上,它为我们揭示了回归分析的理论基础。

温馨提示:答案为网友推荐,仅供参考
相似回答