估计标准误差数值越大,说明回归直线的代表性越小。
提到回归直线,首先要知道变量的相关性。变量与变量之间的关系常见的有两类:一类是确定性的函数关系,像正方形的边长a和面积S的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是随机性的。
当两个相互关系的量具有这两种变量关系的时候,就称两个变量具有相关关系。在此基础上,可以画出y随x变化的图形,将已知的数据在所作的直角坐标系中进行描点。这样的图形叫做散点图。
在回归分析中,用来描述具有线性关系的因变量y与自变量xi的关系曲线,其一般表达式是y=a+∑bixi,i=1,2,…,n。
回归直线方程是根据样本资料通过回归分析所得到的反映一个变量(因变量)对另一个或一组变量(自变量)的回归关系的数学表达式。指在一组具有相关关系的变量的数据(x与Y)间,一条最好地反映x与Y之间的关系直线。
离差作为表示xi对应的回归直线纵坐标y与观察值yi的差,其几何意义可用点与其在回归直线竖直方向上的投影间的距离来描述。数学表达:yi-y^=yi-a-bxi。总离差不能用n个离差之和来表示,通常是用离差的平方和即(yi-a-bxi)^2计算。