如何理解相关系数?

如题所述

如何理解相关系数?

皮尔逊相关系数的取值范围为[-1,1],其绝对值越接近1相关性越强,绝对值越接近于0,相关性越弱,相关系数小0时说明两个变量之间呈现负相关,大于0,则为正相关,对于相关性强度可以参考下表:

皮尔逊相关分析分前提条件:

(1)两个变量为定量变量

(2)两个变量都呈正态分布

(3)两个变量的观测值相互独立

其计算公式如下:

可以使用SPSSAU快速得到相关系数:

结果如下:

温馨提示:答案为网友推荐,仅供参考
第1个回答  2023-01-24

相关系数越大,说明两个变量之间的关系就越强。当相关系数为1时,两个变量其实就是一次函数关系。

相关系数介于0与1之间,用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。

相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。

扩展资料

(1)相关系数的应用

1、概率论

例:若将一枚硬币抛n次,X表示n次试验中出现正面的次数,Y表示n次试验中出现反面的次数。计算ρXY。

解:由于X+Y=n,则Y=-X+n,根据相关系数的性质推论,得ρXY = − 1。

2、企业物流

例:一种新产品上市,在上市之前,公司的物流部需把新产品合理分配到全国的10个仓库,新品上市一个月后,要评估实际分配方案与之前考虑的其他分配方案中,是实际分配方案好还是其中尚未使用的分配方案更好。

通过这样的评估,可以在下一次的新产品上市使用更准确的产品分配方案,以避免由于分配而产生的积压和断货。表1是根据实际数据所列的数表。

通过计算,很容易得出这3个分配方案中,B的相关系数是最大的,这样就评估到B的分配方案比实际分配方案A更好,在下一次的新产品上市分配计划中,就可以考虑用B这种分配方法来计算实际分配方案。

3、聚类分析

例:如果有若干个样品,每个样品有n个特征,则相关系数可以表示两个样品间的相似程度。借此,可以对样品的亲疏远近进行距离聚类。例如9个小麦品种(分别用A1,A2,...,A9表示)的6个性状资料见表2,作相关系数计算并检验。

由相关系数计算公式可计算出6个性状间的相关系数,分析及检验结果见表3。由表3可以看出,冬季分蘖与每穗粒数之间呈现负相关(ρ = − 0.8982),即麦冬季分蘖越多,那么每穗的小麦粒数越少,其他性状之间的关系不显著。

(2)相关系数的缺点:

需要指出的是,相关系数有一个明显的缺点,即它接近于1的程度与数据组数n相关,这容易给人一种假象。

因为,当n较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于1;当n较大时,相关系数的绝对值容易偏小。特别是当n=2时,相关系数的绝对值总为1。因此在样本容量n较小时,我们仅凭相关系数较大就判定变量x与y之间有密切的线性关系是不妥当的。

参考资料来源

百度百科-相关系数

相似回答