请问第七章相关与回归分析的主要内容是什么?

如题所述

第七章 相关与回归分析
1、如何区别相关关系与函数关系?二者有何联系?
相关关系和函数关系的区别在于:相关关系反映现象之间存在着一定的依存关系,但它们是一种不严格不确定的依存关系。在这种关系中,某一变量的每一个数值,可以有另一变量的若干个数值与之相对应。而函数关系是反映现象之间存在着严格的依存关系,在这种关系中,对于某一变量的每一个数值,都有另一个变量有一确定的数值与之相对应,且这种关系可用一个函数式表达出来。
二者的关系在于函数关系在实践中由于观察或测量等误差,往往通过相关关系表现出来。在研究相关关系时,为描述相关关系的一般(或平均)的数量变化规律,常借用函数表达式来近似地表示。如圆面积=πr2,这是函数关系,对于一个具体的圆来讲,圆半径r的大小是固定的也是唯一的,相应的圆面积也是唯一固定的。但在测量时,可能由于测量人不同,或测量工具的误差,几次测量可能得到几个不同的r值,圆面积也相应发生变化,表现为相关关系。又如施肥量和产量间若存在直线正相关关系,即在一定范围内,施肥量增加,产量也增加。但一定的施肥量,对应着不同地块的若干个产量,为研究每增加一定数量(如1公斤)的施肥量,产量一般(或平均)可能增加多大的量,则可借用直线方程Y=a+bx来近似表达。
2、直线相关分析与直线回归分析的区别。
相关分析与回归分析是两个相似的但又是不同的分析方法,在学习中很容易混淆。因此了解与掌握相关分析与回归分析的区别在学习中就非常重要。以下是相关分析与回归分析的主要区别:
(1)相关关系中的两个变量是对等关系,无所谓自变量和因变量。但在回归分析中,两变量不是对等关系,必须确定哪个是自变量,哪个是因变量。
(2)回归分析中的回归方程是根据自变量的给定值来推算或估算因变量值的,反映的是变量间具体的变动关系。而相关分析中的相关系数只是一个抽象的系数。
(3)回归分析中自变量不是随机变量,而相关分析中两变量都必须是随机变量。
(4)在相关分析中两变量只能计算出一个相关系数。但在回归分析中,两变量却可以编制两个回归方程:“y倚x”或“x倚y”回归方程。
3、如何识别相关关系的类型?
按相关涉及因素的多少分,可分为单相关和复相关:只涉及两个因素的相关称为单相关,涉及三个及三个以上因素的相关称为复相关。
按相关关系的表现形态可分为直线相关和曲线相关。判别时可结合散点图来区分。
按现象变化的方向可分为正相关和负相关。现象间的相关关系是正相关还是负相关,可根据经验,也可结合相关表、图,还可根据相关系数(r)或回归系数(b)的正负号来判断。
按相关程度可分为完全相关、不完全相关和不相关。识别时可根据经验,主要是根据相关系数的绝对值判别:在直线相关时,相关系数的绝对值为1,则为完全相关;相关系数的绝对值介于0与1之间,则为不完全相关(相关关系实际是指这种不完全相关);相关系数为零,则无直线相关关系。
4、如何衡量现象间相关关系的密切程度?相关系数运用的前提是什么?
借用相关图、表可简略判断现象间相关关系的密切程度,估计标准误差也可间接反映相关关系的密切程度。但要准确地定量分析判断相关关系的密切程度,则需用专门的指标。曲线相关关系的密切程度是用相关指数(R)来衡量,直线相关关系的密切程度是用相关系数(r)来衡量的。
相关关系只能用来判断直线相关条件下相关关系的密切程度,特别是当相关系数为零时,一般应说是无直线相关关系,而不能说现象间不相关,因为这时有可能存在曲线相关,只是不存在直线相关罢了。
5、相关系数的计算公式是什么?取值范围是什么?如何用相关系数判断直线相关的密切程度和方向?
相关系数的计算公式本章主要介绍了积差法和简捷法,公式分别为 与 。实际工作中主要是用简捷法计算相关系数。
相关系数是不带计量单位的,有正负号的具有抽象性质的比值,取值范围为-1≤r≤+1之间。
用相关系数来判断相关方向,是根据相关系数的正负号来决定的,正号为正相关,负号为负相关。
直线相关关系的密切程度则是根据相关系数的绝对值来判断的。相关系数的绝对值为1,表明现象间有完全的直线相关。相关系数为零,表明现象间无直线相关。相关关系实际是指相关系数绝对值介于0与1之间的不完全相关:相关系数的绝对值在0.3以下无直线相关,0.3~0.5低度直线相关,0.5~0.8显著直线相关,0.8以上高度直线相关。一般只有在高度相关时,才有进一步进行回归分析的必要。
6、用最小平方法配合回归直线方程的步骤是什么?参数a与b的几何意义和经济意义是什么?
最小平方法配合回归方程的基本步骤是:第一,用定性分析并借助相关图、表判断现象间有无直线相关关系。第二,计算相关系数(r)判断相关密切程度,一般在高度相关时才进行回归分析。第三,正确确定自变量和因变量。最后,用最小平方法估计a与b,配合回归直线,即:

参数a的几何意义是直线在y轴上的截距,其经济意义是回归直线的起始值。参数b的几何意义是直线的斜率,也称回归系数,经济意义是当自变量增加一个单位时,因变量的平均增减值。
7、相关系数(r)和回归系数(b)是否同号?为什么?
相关系数和回归系数的正负号是相同的,即r为正,b也为正;r为负,b也为负。故也可根据b来判定是正相关和负相关。
用积差法计算相关系数的公式为:
,从公式中可看出,分母必为正数,分子则可正可负。可见r的符号取决于分子的符号。回归系数的计算公式为 ,可推出 。可见其分母也必为正数,而分子则与相关系数的分子完全一样,不仅符号相同,而且数值也相同。因此,相关系数与回归系数的符号是一致的。
8、什么是回归估计标准误差?有什么作用?它与标准差(σ)和抽样误差(μ)有什么异同?
回归估计标准误差就是用来说明回归方程推算结果准确程度的统计分析指标,或者说是反映回归直线代表性大小的统计分析指标。
回归估计标准误差是用以反映回归直线的代表性大小,或者说是反映因变量估计值的准确程度。回归估计标准误差大,说明回归直线的代表性小,估计值的准确性低;回归估计标准误差小,说明回归直线的代表性大,估计值的准确性高。回归估计标准误差在一定程度上也可反映相关关系的密切程度,但不甚准确。
回归估计标准误差和标准差、抽样误差在性质上是相同的指标,即都是反映某种指标的代表性大小,或者反映说明某种指标的准确程度。标准差反映平均数的代表性大小,是各变量值与平均数的平均误差;抽样误差反映用样本指标推断估计总体指标的代表性大小,是样本指标与总体指标的平均误差;回归估计标准误差反映回归直线的代表性大小,是实际值与估计值的平均误差。
9、总离差平方和可分解为哪两个部分?其含义是什么?估计标准误差是根据哪部分计算的?
总离差平方和是指所有点的因变量实际值(Y)与平均数( )间离差(误差)平方的总和,即 。可分解为因变量实际值(Y)与估计值(Yc)间离差(误差)平方的总和,即 ;和因变量估计值(Yc)与平均数( )间离差(误差)平方的总和,即 。即有
= + 。
称为回归平方和,这部分误差平方和由于X与Y的直线回归关系造成的,即由于X的变化而引起的。 称为剩余平方和,这部分误差平方和是除X对Y的线形影响外,剩余的其它一切因素而引起的,又称残差平方和。
估计标准误差是根据剩余平方和这部分来计算的,从公式
可明确看出。
回归平方和与剩余平方和数值间存在此消彼长的关系。回归平方和占总离差平方和的比重大,则剩余平方和占总离差的比重小,这时计算的估计标准误差也较小,回归直线代表性大;反之则估计标准误差较大,回归直线代表性小。
10、相关系数与回归标准误差之间有什么关系?
首先,从作用上看,相关关系反映直线相关关系的密切程度,但也可间接反映回归估计值的准确程度,或回归直线的代表性;估计标准误差是用来反映回归估计值的准确程度,或者说反映回归直线代表性的,但也可间接反映直线相关关系的密切程度。其次,从计算上看,二者可互相推算,即 , 。但需注意根据 计算出来的相关系数均为正值,这时只能根据其值大小判断直线相关的密切程度,而不能判断相关的方向,必须结合回归系数b的正负号来判断是正相关还是负相关。
温馨提示:答案为网友推荐,仅供参考
相似回答