方差分析（analysis of variance）基本概念

如题所述

第1个回答 2022-06-10

方差分析（analysis of variance）用于研究一个或多个 分类型自变量 与一个 数值型因变量 的关系。
方差分析通过检验多个总体的均值是否相等来判断一个或多个分类型自变量对数值型因变量是否由显著影响。

当方差分析中只涉及一个分类型自变量时称为单因素方差分析。
1）对于因素的每一个水平，其观测值是来自正态分布总体的简单随机样本。但是当每个水平对应的样本量较大时，对非正态性有一定容忍度。
2）因素的每一个水平，各个正态分布总体的方差σ 2 必须相等。当每个水平或分组对应的样本数量相等或相近时，ANOVA对方差相等的要求也不是特别敏感。
3）观测值是相互独立的。
**注意：当满足假设1），那么每个水平的均值[图片上传失败...(image-6be2de-1634719989509)]

也服从正态分布，当同时满足假设2），那么在进行方差分析时，原假设各水平均值相等，等价于假设这些水平的均值来源于同一个正态分布。这是构造检验统计量的基础。**

如果存在两个分类变量，需要分析是一个分类变量对因变量起作用，还是两个变量起作用，还是都不起作用。
（1）无交互作用或无重复双因素方差分析
两个因素是独立的，不存在联系。

对于三个因素的方差分析，分析方法与双因素类似，只不过交互效应种类更多，包括1个三因素交互效应，3个二因素交互效应。对于三因素交互效应，比如A×B×C，可以拆解为A×（B×C）。可见，二因素交互作用依赖于三因素交互作用。因此，在进行三因素方差分析时，应该先看是否有三因素交互作用，如果存在，按照某个因素（比如因素A）的不同取值拆分数据集，然后在不同数据集下分析二因素交互作用；如果不存在三因素交互作用，则对3个进行二因素方差分析，分别看是否有二因素交互作用。
而对于四个及以上的因素，进行方差分析时，由于因素组合太多了，导致不同分组均值差异的影响因素也太多了，能为我们提供的信息变得模糊。因此，四个因素及以上做方差分析意义不大。

对于一组样本，分别在不同试验条件下得出的多组数据，在观察者多组数据平均值是否有差异时，就需要使用重复ANOVA。
相比于常规ANOVA的方差分解，重复ANOVA的组内平方和包含了个体间的差异的平方和及误差两部分，因此，在构件统计量时，组内平方和需要剔除个体间平方和。原理如下图所示。

因此，如果成对样本得到的多组数据，仍然利用常规的ANOVA计算方法，结果倾向于不显著，也就是各组间无显著性差异。
重复ANOVA的统计量计算公式如下：
[图片上传失败...(image-c9a202-1634719989510)]

其中，s为组数，m为每组个体的数量。

方差分析只能告诉我们某个因素是否对结果有显著性的影响，但不能告诉我们具体哪些水平或水平组合对结果显著，因此需要进行事后检验（ post-hoc test），最常用的方法是Turkey-Kramer检验。
统计学中有一个描述来自同一正态总体的多组数据平均值最大与最小的两组的差值的分布，叫做学生范围分布（ Studentized range distribution ）。Turkey-Kramer检验依据的就是这个分布，这个分布由样本量，组数，样本的平均方差决定。给定显著性水平α，依据这个分布可以计算出一个阈值，只要被比较的两组数据的平均值之差大于这个阈值，就可以认为是显著的。这个阈值的计算公式如下：
[图片上传失败...(image-26c27d-1634719989509)]

其中，q α;k;N-k 代表给定显著性水平，组数，总样本数下，通过平均值最大和最小值的两组数据计算的学生范围分布下的阈值，MSE代表样本所有数据的波动情况，n i 和n j 为两个样本的数据量大小。
由于Turkey-Kramer检验的阈值是利用样本中平均值差距最大的两组数据计算而来的，这个阈值对于其他两组数据的平均值差比较保守，因此Turkey-Kramer检验牺牲了一定的统计功效。
此外，对于多个实验组与对照组进行比较，可以利用Dunnett 检验。比如对于四组数据（三组试验组，一个对照组），Dunnett 检验只需要比较三次，而Turkey-Kramer检验需要比较六次，所以Dunnett 检验为修正假阳性牺牲的统计功效更少。

在功效分析中，统计功效，显著性水平，效应大小和样本量，知道其中三个，另外一个就可以唯一确定。给定方差分析的显著性水平，期望达到的统计功效和效应值，就可以确定样本量。
在方差分析中，效应值一般有两种表示形式，一种是Cohen氏 f 值：组间平方和与组内平方和比值再开方：
[图片上传失败...(image-8c95a2-1634719989509)]

Cohen本人在提出f值的时候也将其大约分成了小中大三个区间，在单因素ANOVA检验中，小效应对应f值在0.1左右，中效应对应的f值在0.25左右，大效应在0.4左右。
另外一种是η 2 ：组间平方和与总平方和比值再开方：
[图片上传失败...(image-55026d-1634719989509)]

在重复测量ANOVA实验设计时，采用的效应值大小应该考虑个体间差异，相应的效应值Cohen氏 f 值：
[图片上传失败...(image-be9667-1634719989509)]

</article>

0人点赞

相似回答

什么是方差分析?答：方差分析（analysis of variance，ANOVA ）的基本思想就是根据资料的设计类型，即变异的不同来源将全部观察值总的离均差平方和（sum of squares of deviations from mean，SS）和自由度分解为两个或多个部分。除随机误差外，其余每个部分的变异可由某个因素的作用（或某几个因素的交互作用）加以解释，...

什么是方差分析答：方差分析(Analysis of Variance，简称ANOVA)，又称“变异数分析”，是一种假设检验方法，即基本思想可概述为：把全部数据的总方差分解成几部分，每一部分表示某一影响因素或各影响因素之间的交互作用所产生的效应，将各部分方差与随机误差的方差相比较,依据F分布作出统计推断，从而确定各因素或交互作用的效...

什么是方差分析?答：方差分析的基本思想是：通过分析研究不同来源的变异对总变异的贡献大小，从而确定可控因素对研究结果影响力的大小。方差分析（Analysis of Variance，简称ANOVA），又称“变异数分析”，是R.A.Fisher发明的，用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响，研究所得的数据呈现波动状。造...

什么是方差分析?答：方差分析（Analysis of Variance，ANOVA）和假设检验（Hypothesis Testing）是统计学中两种常用的方法，但它们在目的、应用场景和数据分析方面有所区别。1、目的:方差分析的目的是比较两个或多个组之间的均值是否存在显著差异。它通过计算组内变异与组间变异的比例来判断差异的显著性。假设检验的目的是根据...

什么是方差分析?答：方差分析包括单因素方差分析和多因素方差分析，因为自变量只有一个（“组别”），所以使用单因素方差分析进行研究即可。三、软件操作及结果解读 (一) 数据导入 1.数据格式首先将数据整理成正确的格式，一般X一列，Y为一例，并且分析的数据带有数据标签的，需要另添加一个表格进行说明，数据格式如下：2....

方差分析法介绍答：1、根据试验结果，怎样找出有显著作用的因素，以及找出在怎样的水平和工艺条件下能使指标最优以达到优质和高产的目的，这就是方差分析(Analysis of Variance 简称ANOVA)所要去解决的。2、进行试验(实验)时,我们称可控的试验条件为因素(Factor),因素变化的各个等级为水平(Level)。3、如果在试验中只有一个...

方差分析(1)答：方差分析(Analysis of Variance，简称ANOVA)，又称“变异数分析”，是由英国统计与遗传学家R.A.Fisher发明。方差分析主要用于两个及两个以上样本均数差别的显著性检验。方差分析又称F检验，字母F是发明者Fisher姓氏的首字母。方差分析的核心思想是变异度的分解，分析的主要过程是F统计量的构建。在对数值...

SPSS与方差分析(F检验)答：方差分析（Analysis Of Variance），记作ANOVA，实质上是采用数理统计的方法对所得结果进行分析，以鉴别各种因素对研究对象的某些特性值影响大小的一种有效方法。方差分析是基于变异分解的思想进行的，整个样本的变异可以看作：单因子方差分析用来研究一个因子的不同水平是否对指标产生了显著影响。例如：...

大家正在搜

residualvariance genetic variance capacityvariance pooled variance implied variance yield variance sample variance volume variance equal variance