数据挖掘与数理统计的联系是什么?

如题所述

数据挖掘不是为了替代传统的统计分析技术。相反,它是统计分析方法学的延伸和扩展。大多数的统计分析技术都基于完善的数学理论和高超的技巧,预测的准确度还是令人满意的,但对使用者的要求很高。而随着计算机能力的不断增强,有可能利用计算机强大的计算能力只通过相对简单和固定的方法完成同样的功能。
对于数据挖掘与统计,可以考虑:数据库系统与文件系统。那么这两者实质的区别在哪里,计算机系的人总会回答的,因为数据库也好,文件系统也好,都是计算机行业的术语。在文件系统基础上的:因为大家都知道,数据库系统的数据库管理系统(DBMS)是建立现在的问题到了数据挖掘与统计,数据挖掘算法有些本来就是统计的方法,那么到了计算机行业,自有计算机行业规则,人们研究数据挖掘会关心它和大数据量的结合(有效性),会关心它的数据挖掘原语(数据挖掘语言),准的接口等只有用软件实现时候才考虑的事项。算法性能的优化、标于是数据挖掘行业制定了一些标准,比如基于XML的PMML.(预言模型标记语言);微软的OLE DB For DM;SPSS的CRISP-DM.当数据挖掘的研究到这个程度,很难看到和统计的关联。从这个意义上讲,是计算机行业的一个方向,而不就是广义统计的一个部分。同时,数据挖掘仍然自机器学习和人工智能的一部分,其核心是规则,对于数据挖掘算法中来统计的,但是这种技术本身已经不属于统计了。这是一个数据挖掘算法可以得出的规则,在得出这样的规则之前,算法会对数据集进行分析,该数据集包括很多变量(数据库的字段),假设是10个,“年龄”和“工资”是其中的两个,算法会根据历史数据自动抽取这两个变量,而得出这样的规则。但是对于统计,是不能得出的,它只能得出量化的概率关系,而规则的推导应该不是统计学的范畴。
科学在进步,科学进步导致了学科的细分,科的人才来研究和发展它。数据挖掘作为一个新型的学科,结合各学数据挖掘就其算法本身,论的解释,但是作为一个整体的研究方向,很大一部分可以从数理统计中获得理应该从计算机的层面进行全局的考虑。即从系统的角度进行分析,毕竟数据挖掘是面向应用的,一个再完美的算法,如果只能对几百条数据进行分析,那么是没有用的。
温馨提示:答案为网友推荐,仅供参考
相似回答