如何计算相关系数r

如题所述

相关系数r的计算公式是ρXY=Cov(X,Y)/√[D(X)]√[D(Y)]。

公式描述:公式中Cov(X,Y)为X,Y的协方差,D(X)、D(Y)分别为X、Y的方差。

公式。

若Y=a+bX,则有:

令E(X) =μ,D(X) =σ。

则E(Y) = bμ+a,D(Y) = bσ。

E(XY) = E(aX + bX) = aμ+b(σ+μ)。

Cov(X,Y) = E(XY)−E(X)E(Y) = bσ。

相关系数缺点

需要指出的是,相关系数有一个明显的缺点,即它接近于1的程度与数据组数n相关,这容易给人一种假象。

因为,当n较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于1;当n较大时,相关系数的绝对值容易偏小。特别是当n=2时,相关系数的绝对值总为1。因此在样本容量n较小时,我们仅凭相关系数较大就判定变量x与y之间有密切的线性关系是不妥当的。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2023-08-31
相关系数r通常使用下面的公式计算:
r= (n∑xy-∑x∑y) ÷ ((n∑x^2-(∑x)^2)(n∑y^2-(∑y)^2))^1/2
其中,x和y分别代表两个变量(或两个赋值列),n代表数据样本的数量,∑xy代表x和y对应的数据乘积之和,∑x和∑y分别表示x和y的数据之和,∑x^2弱的线性关系;当相关系数为-1时,表明两个变量之间的线性关系紧密,但是是负相关
相似回答