常用统计学方法

如题所述

统计方法
统计方法是指有关收集、整理、分析和解释统计数据,并对其所反映的问题作出一定结论的方法。统计方法是一种从微观结构上来研究物质的宏观性质及其规律的独特的方法。统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方 法。随着人们对定量研究的日益重视,统计方法已被应用到自然科学和社会科学的众多领域,统计学也已发展成为由若干分支学科组成的学科体系。可以说,几乎所有的研究领域都要用到统计方法,比如政府部门、学术研究领域、日常生活中、公司或企业的生产经营管理中都要用到统计
统计方法是指有关收集、整理、分析和解释统计数据的方法。
统计方法
统计资料丰富且错综复杂,要想做到合理选用统计分析方法并非易事。对于同一个资料,若选择不同的统计分析方法处理,有时其结论是截然不同的。
正确选择统计方法的依据是:
①根据研究的目的,明确研究试验设计类型、研究因素与水平数;
②确定数据特征(是否正态分布等)和样本量大小;
③ 正确判断统计资料所对应的类型(计量、计数和等级资料),同时应根据统计方法的适宜条件进行正确的统计量值计算;
最后,还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择统计分析方法。
统计方法
统计分类
1 计量资料的统计方法
分析计量资料的统计分析方法可分为参数检验法和非参数检验法。
参数检验法主要为t检验和方差分析(ANOVA,即F检验)等,两组间均数比较时常用t检验和u检验,两组以上均数比较时常用方差分析;非参数检验法主要包括秩和检验等。t检验可分为单组设计资料的t检验、配对设计资料的t检验和成组设计资料的t检验;当两个小样本比较时要求两总体分布为正态分布且方差齐性,若不能满足以上要求,宜用非参数方法(秩和检验)。方差分析可用于两个以上样本均数的比较,应用该方法时,要求各个样本是相互独立的随机样本,各样本来自正态总体且各处理组总体方差齐性。根据设计类型不同,方差分析中又包含了多种不同的方法。对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适的统计分析方法,不应盲目套用t检验和单因素方差分析。
统计方法
2 计数资料的统计方法
计数资料的统计方法主要针对四格表和R×C表利用
检验进行分析。 四格表资料:组间比较用
检验或u检验,若不能满足 检验:当计数资料呈配对设计时,获得的四格表为配对四格表,其用到的检验公式和校正公式可参考书籍。 R×C表可以分为双向无序,单向有序、双向有序属性相同和双向有序属性不同四类,不同类的行列表根据其研究目的,其选择的方法也不一样,具体见表1。
3 等级资料的统计方法
等级资料(有序变量)是对性质和类别的等级进行分组,再清点每组观察单位个数所得到的资料。在临床医学资料中,常遇到一些定性指标,如临床疗效的评价、疾病的临床分期、病症严重程度的临床分级等,对这些指标常采用分成若干个等级然后分类计数的办法来解决它的量化问题,这样的资料统计上称为等级资料。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2020-09-15
感知机 二分类

二分类的线性分类模型,也是判别模型。
目的是求出把训练数据进行线性划分的分离超平面。
感知机是神经网络和支持向量机的基础。
学习策略:极小化损失函数。损失函数对应于误分类点到分离超平面的总距离。
基于随机梯度下降法对损失函数的最优化算法,有原始形式和对偶形式。

K近邻法 K-nearest neighbor, K-NN 多分类和回归

是一种分类和回归方法,有监督学习。在训练数据集中找到和新的输入实例最接近的K个实例,这k个实例的多数类别就是这个新实例的类别。
三要素:K的选择,距离度量,分类决策规则。
实现方法:kd树(二叉树)快速搜索K个最近邻的点。
K值选择:反映了对近似误差和估计误差的权衡。交叉验证选择最优的K值,K小,模型复杂,K大,模型简答。

朴素贝叶斯法 多分类 用于NLP

朴素贝叶斯法是基于贝叶斯定理和特征条件独立假设的分类方法。首先学习输入输出的联合概率分布,然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。
后验概率最大等价于0-1损失函数的期望风险最小化。
是典型的生成学习方法,由训练数据求出联合概率分布,再求出条件概率分布(后验概率)。
概率估计方法是:极大似然估计或者贝叶斯估计。
基本假设是条件独立性

决策树 decision tree 多分类,回归

是一种分类和回归算法。包括三个步骤:特征选择,决策树生成和决策树的修剪,常用算法:ID3,C4.5,CART

逻辑斯地回归和最大熵模型 多分类

本质就是给线性回归添加了对数函数
它的核心思想是,如果线性回归的结果输出是一个连续值,而值的范围是无法限定的,那我们有没有办法把这个结果值映射为可以帮助我们判断的结果呢。
而如果输出结果是 (0,1) 的一个概率值,这个问题就很清楚了。我们在数学上找了一圈,还真就找着这样一个简单的函数了,就是很神奇的sigmoid函数(如下):
逻辑回归用于二分类和多分类
逻辑斯地分布是S型曲线
最大熵模型:熵最大的模型是最好的模型。
X服从均匀分布时候,熵最大
最大熵模型的学习等价于约束最优化问题。
对偶函数的极大化等价于最大熵模型的极大似然估计。
模型学习的最优化算法有:改进的迭代尺度法IIS,梯度下降法,牛顿法,或者拟牛顿法

支持向量机 二分类

线性可分支持向量机利用间隔最大化求最优分离超平面。
函数间隔
第2个回答  2020-09-15
统计方法是指有关收集、整理、分析和解释统计数据,并对其所反映的问题作出一定结论的方法。统计方法是一种从微观结构上来研究物质的宏观性质及其规律的独特的方法。统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方 法。随着人们对定量研究的日益重视,统计方法已被应用到自然科学和社会科学的众多领域,统计学也已发展成为由若干分支学科组成的学科体系。可以说,几乎所有的研究领域都要用到统计方法,比如政府部门、学术研究领域、日常生活中、公司或企业的生产经营管理中都要用到统计学。
第3个回答  2020-09-15
常用统计方法:1、统计表(单式和复式)。
2、统计图(条形、折线、扇形)。
相似回答