基于一个变量状态的信息对另一个变量的贡献程度而构造的用于度量分类数据相合的系数有哪些

如题所述

1、列联系数,简称c系数,主要用于大于2×2列联表的情况。当列联表中的两个变量相互独立时,系数c=0,但它不可能大于1,这一点从式(9.7)中也可以反映出来。

c系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R和C的增大而增大。例如,当两个变量完全相关时,对于2×2表,c=0.7071;对于3×3表,c=0.8165;而对于4×4表,c=0.87。

2、协方差,在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 

3、Cramer V系数,是线性代数中一个关于求解线性方程组的定理。它适用于变量和方程数目相等的线性方程组,是瑞士数学家克莱姆(1704-1752)于1750年,在他的《线性代数分析导言》中发表的。

其实莱布尼兹〔1693〕,以及马克劳林〔1748〕亦知道这个法则,但他们的记法不如克莱姆。对于多于两个或三个方程的系统,克莱姆的规则在计算上非常低效;与具有多项式时间复杂度的消除方法相比,其渐近的复杂度为O(n·n!)。

扩展资料

在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

期望值分别为E[X]与E[Y]的两个实随机变量X与Y之间的协方差Cov(X,Y)定义为:

从直观上来看,协方差表示的是两个变量总体误差的期望。

如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

如果X与Y是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足E[XY]=E[X]E[Y]。

但是,反过来并不成立。即如果X与Y的协方差为0,二者并不一定是统计独立的。

协方差Cov(X,Y)的度量单位是X的协方差乘以Y的协方差。而取决于协方差的相关性,是一个衡量线性独立的无量纲的数。

协方差为0的两个随机变量称为是不相关的。

参考资料来源:百度百科—协方差

参考资料来源:百度百科—列联相关系数

温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-07-11

有列联系数,fi系数,Cramer V系数

列联相关系数又称列联系数(coefficient of contingency),简称c系数,主要用于大于2×2列联表的情况。当列联表中的两个变量相互独立时,系数c=0,但它不可能大于1,这一点从式(9.7)中也可以反映出来。

c系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R和C的增大而增大。例如,当两个变量完全相关时,对于2×2表,c=0.7071;对于3×3表,c=0.8165;而对于4×4表,c=0.87。

扩展资料

卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。

步骤

(1)提出原假设:

H0:总体X的分布函数为F(x).

如果总体分布为离散型,则假设具体为

H0:总体X的分布律为P{X=xi}=pi, i=1,2,...

(2)将总体X的取值范围分成k个互不相交的小区间A1,A2,A3,…,Ak,如可取

A1=(a0,a1],A2=(a1,a2],...,Ak=(ak-1,ak),

其中a0可取-∞,ak可取+∞,区间的划分视具体情况而定,但要使每个小区间所含的样本值个数不小于5,而区间个数k不要太大也不要太小。

(3)把落入第i个小区间的Ai的样本值的个数记作fi,成为组频数(真实值),所有组频数之和f1+f2+...+fk等于样本容量n。

(4)当H0为真时,根据所假设的总体理论分布,可算出总体X的值落入第i 个小区间Ai的概率pi,于是,npi就是落入第i个小区间Ai的样本值的理论频数(理论值)。

(5)当H0为真时,n次试验中样本值落入第i个小区间Ai的频率fi/n与概率pi应很接近,当H0不真时,则fi/n与pi相差很大。基于这种思想,皮尔逊引进如下检验统计量

 

在0假设成立的情况下服从自由度为k-1的卡方分布。

参考资料来源:百度百科-列联系数

百度百科-卡方检验

本回答被网友采纳
第2个回答  2018-12-05
贡献程度?没听过。。。两个变量之间的关系倒是蛮多,协方差,相关系数,卡方检验,KL散度。。。。本回答被网友采纳
第3个回答  2018-12-08
列联系数
fi系数
Cramer V系数
相似回答