大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据有五大特点,即大量、高速、多样、低价值密度、真实性。它并没有统计学的抽样方法,只是观察和追踪发生的事情。
大数据的用法倾向于预测分析、用户行为分析或某些其他高级数据分析方法的使用。
大数据在生活中使用广泛,比如打开淘宝会有些推荐商品,大部分都是根据搜集你日常的喜好出现的。大数据的出现,一方面使广告投放更加精准,也方便了用户,但是另一方面,信息的泄露也给用户带来困扰。
虽然提到可视化经常说的是数据可视化,但是大数据并不等于可视化。
可视化的利用的是数据,数据只是可视化结果呈现的构成部分。
数据可视化借助于图形化手段,把收集数据进行处理和运算,通过可视化技术,深度挖掘、呈现背后深层次的指标、规律,并结合不同行业业务需求,清晰有效地传达与沟通信息,给用户带来良好的视觉效果,降低用户的理解难度,从而实现帮助各行业用户驾驭数据,洞悉价值,提升决策效率和能力的目的。
数据可视化降低了数据分析的门槛,即使观众不是统计学专家,不懂各种复杂的数学公式,也一样可以快速的从图中发现一些问题,探察到潜在的商业价值,从而帮助制定更好的商业决策。同时,数据可视化工具也降低了观众的学习成本,观众并不需要了解那些专业的统计学工具、建模工具如何使用,也不需要回任何编程语言,只需要将数据连接上,通过托拉拽等方式,就可以很容易地构建出相对定制化的可视化图形来供其进行研究。