1. Excel / Spreadsheet
http://www.openoffice.org/download/
excel 基本上支持了最常用的数据分析功能:用来概述(总结)数据特征,数据可视化,对数据转型(去除噪音数据)从而得到新的数据集用来分析等。尽管Microsoft excel这个软件是付费的,但你可以用其替代品,例如open office, google docs!
2. Trifacta
https://www.trifacta.com/start-wrangling/
excel在数据大小上有限制,但这个工具没有这样的局限,您可以安全地用它处理大数据集。这个工具有令人难以置信的特性,如图表推荐、内置算法、分析洞察力,您可以使用这些特性在任何时间内生成报告。
3. Rapid Miner
https://rapidminer.com/
在建立机器学习模型方面的具有专业性,包含了我们经常使用的所有ML算法。能闪电般的快速水平上提供分析经验。他们的生产线上有几个为大数据、可视化、模型部署而构建的产品,其中一些产品(企业)包括订阅费。
4. Rattle GUI
https://cran.r-project.org/bin/windows/base/
提供了足够的选项来探索、转换和建模数据。它在统计分析方面的选择比SPSS少。但是,SPSS是一个付费工具。
5. Qlikview
http://global.qlik.com/us/landing/go-sm/qlikview/download-qlikview
获得商业洞察力并以一种极具吸引力的方式将其呈现出来。有了它较先进的可视化功能,你会惊讶于你在处理数据时所得到的控制量。它有一个内置的推荐引擎,可以不时地更新有关较佳可视化的信息。
6. Weka
https://www.analyticsvidhya.com/learning-paths-data-science-business-analytics-business-intelligence-big-data/weka-gui-learn-machine-learning/
使用Weka的一个优点是它很容易学习。作为一个机器学习工具,它的界面是足够直观的,你可以迅速完成工作。它为数据预处理、分类、回归、聚类、关联规则和可视化提供了选择。建立在Java之上。
7. KNIME
https://www.knime.org/knime-analytics-platform
提供了一个开放源码的分析数据的平台,以后可以使用其他支持KNIME的产品进行部署。该工具在数据融合、可视化和先进的机器学习算法等方面具有丰富的特点。
8. Orange
http://orange.biolab.si/
目的是产生交互式数据可视化和数据挖掘任务。YouTube上有足够的教程来学习这个工具。它有一个广泛的数据挖掘任务库,包括所有的分类、回归、聚类方法。
9. Tableau Public
https://public.tableau.com/s/
Tableau是一个数据可视化软件。快速探索数据的可视化软件,每一次观察都可使用各种可能的图表。它是一种由自己计算出数据类型、可用的较佳方法等的智能算法。
10. Data Wrapper
这是一个闪电般的快速可视化软件。可视化桶由线条图、条形图、列图、饼图、叠加条形图和地图组成。此工具启用浏览器,不需要任何软件安装。
11. Data Science Studio (DSS)
http://www.dataiku.com/dss/trynow/
它是一个旨在连接技术,业务和数据的强大工具。它可分为两部分:编码和非编码。它对任何旨在发展,建立,在网络上部署和扩展模型的组织来说都是一个完整的软件包。
12. OpenRefine
http://openrefine.org/download.html
专门研究混乱的数据;为预测建模目的而清理、转换和塑造数据。使用Open Refine进行改进,分析人员不仅可以节省时间,还可以将其用于生产工作。