大数据是什么呀

如题所述

大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。通过大量的统计了解大家的喜好,想要的东西,从而得到他们想要的,比如精准营销,征信分析,消费分析等等

温馨提示:答案为网友推荐,仅供参考
第1个回答  2018-07-25

    大数据的定义

    对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

    麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

    大数据的特征

    容量(Volume):数据的大小决定所考虑的数据的价值和潜在的信息; 

    种类(Variety):数据类型的多样性; 

    速度(Velocity):指获得数据的速度;  

    可变性(Variability):妨碍了处理和有效地管理数据的过程。

    真实性(Veracity):数据的质量 

    复杂性(Complexity):数据量巨大,来源多渠道 

    价值(value):合理运用大数据,以低成本创造高价值

    大数据的意义

    现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。 阿里巴巴创办人马云来台演讲中就提到,未来的时代将不是IT时代,而是DT的时代,DT就是Data Technology数据科技,显示大数据对于阿里巴巴集团来说举足轻重。

    有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是赢得竞争的关键。

    大数据的价值体现在以下几个方面:

    1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销

    2) 做小而美模式的中小微企业可以利用大数据做服务转型

    3) 面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值

    不过,“大数据”在经济发展中的巨大意义并不代表其能取代一切对于社会问题的理性思考,科学发展的逻辑不能被湮没在海量数据中。著名经济学家路德维希·冯·米塞斯曾提醒过:“就今日言,有很多人忙碌于资料之无益累积,以致对问题之说明与解决,丧失了其对特殊的经济意义的了解。”这确实是需要警惕的。

    在这个快速发展的智能硬件时代,困扰应用开发者的一个重要问题就是如何在功率、覆盖范围、传输速率和成本之间找到那个微妙的平衡点。企业组织利用相关数据和分析可以帮助它们降低成本、提高效率、开发新产品、做出更明智的业务决策等等。例如,通过结合大数据和高性能的分析,下面这些对企业有益的情况都可能会发生:

    1)及时解析故障、问题和缺陷的根源,每年可能为企业节省数十亿美元。

    2)为成千上万的快递车辆规划实时交通路线,躲避拥堵。

    3)分析所有SKU,以利润最大化为目标来定价和清理库存。

    4)根据客户的购买习惯,为其推送他可能感兴趣的优惠信息。

    5)从大量客户中快速识别出金牌客户。

    6)使用点击流分析和数据挖掘来规避欺诈行为。

    大数据的应用

    洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生。

    google流感趋势(Google Flu Trends)利用搜索关键词预测禽流感的散布。

    统计学家内特.西尔弗(Nate Silver)利用大数据预测2012美国选举结果。

    麻省理工学院利用手机定位数据和交通数据建立城市规划。

    梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价。

    医疗行业早就遇到了海量数据和非结构化数据的挑战,而近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析。

    大数据的趋势

    趋势一:数据的资源化

    何为资源化,是指大数据成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。因而,企业必须要提前制定大数据营销战略计划,抢占市场先机。

    趋势二:与云计算的深度结合

    大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。自2013年开始,大数据技术已开始和云计算技术紧密结合,预计未来两者关系将更为密切。除此之外,物联网、移动互联网等新兴计算形态,也将一齐助力大数据革命,让大数据营销发挥出更大的影响力。

    趋势三:科学理论的突破

    随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。

    趋势四:数据科学和数据联盟的成立

    未来,数据科学将成为一门专门的学科,被越来越多的人所认知。各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。与此同时,基于数据这个基础平台,也将建立起跨领域的数据共享平台,之后,数据共享将扩展到企业层面,并且成为未来产业的核心一环。

    趋势五:数据泄露泛滥

    未来几年数据泄露事件的增长率也许会达到100%,除非数据在其源头就能够得到安全保障。可以说,在未来,每个财富500强企业都会面临数据攻击,无论他们是否已经做好安全防范。而所有企业,无论规模大小,都需要重新审视今天的安全定义。在财富500强企业中,超过50%将会设置首席信息安全官这一职位。企业需要从新的角度来确保自身以及客户数据,所有数据在创建之初便需要获得安全保障,而并非在数据保存的最后一个环节,仅仅加强后者的安全措施已被证明于事无补。

    趋势六:数据管理成为核心竞争力

    数据管理成为核心竞争力,直接影响财务表现。当“数据资产是企业核心资产”的概念深入人心之后,企业对于数据管理便有了更清晰的界定,将数据管理作为企业核心竞争力,持续发展,战略性规划与运用数据资产,成为企业数据管理的核心。数据资产管理效率与主营业务收入增长率、销售收入增长率显著正相关;此外,对于具有互联网思维的企业而言,数据资产竞争力所占比重为36.8%,数据资产的管理效果将直接影响企业的财务表现。

    趋势七:数据质量是BI(商业智能)成功的关键

    采用自助式商业智能工具进行大数据处理的企业将会脱颖而出。其中要面临的一个挑战是,很多数据源会带来大量低质量数据。想要成功,企业需要理解原始数据与数据分析之间的差距,从而消除低质量数据并通过BI获得更佳决策。

    趋势八:数据生态系统复合化程度加强

    大数据的世界不只是一个单一的、巨大的计算机网络,而是一个由大量活动构件与多元参与者元素所构成的生态系统,终端设备提供商、基础设施提供商、网络服务提供商、网络接入服务提供商、数据服务使能者、数据服务提供商、触点服务、数据服务零售商等等一系列的参与者共同构建的生态系统。而今,这样一套数据生态系统的基本雏形已然形成,接下来的发展将趋向于系统内部角色的细分,也就是市场的细分;系统机制的调整,也就是商业模式的创新;系统结构的调整,也就是竞争环境的调整等等,从而使得数据生态系统复合化程度逐渐增强。

第2个回答  2018-07-12

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。目前各个行业信息化建设的推进速度一日千里,从事关国计民生的政府服务机构、高等院校,到路边街头的便民网点,各种类型的终端已经无处不在。每时每刻这些终端都在产生数据,这些数据与人们的生产生活息息相关,包含着巨大的可挖掘价值。通过海量数据的层积清洗后数据分析系统VEIDP  可以根据预设公式汇总统计数据,接口可提供标准的JSON 供第三方查询 ,能让信息化建设工作的成果以最直观的形式呈现在人们面前,帮助企业将抽象的数据更为具象的提取并表现,以可视化的方式展现大数据。除和信云桌面的终端、服务器等计算机设备信息汇总外,还可以对接各类企业级MIS 、OA / 市政民生系统的数据库形成大数据中心。通过智能算法将千万级的关联记录或无关联记录汇聚为关系型数据表,可按指令查询汇总出最具价值的数据。

全球(全国)型企业机构可在全景大地图中最直观的了解各个(地区)机构、各楼宇、各房间的计算机分布,终端或设备(传感器)的使用,帮助企业更直观的了解到设备投放后的实际情况。全国到各省、地市、县,按行政区隶属管辖划分分管权限,每个区域的管理员可在自己管辖范围内了解数据。

大数据分析平台可以计算不同区域终端(设备或物件)投放后的实际情况,比如不同操作系统、不同应用应用软件的实际使用率。这些数据可以作为管理层在下一期投放设备时调整方向的参考依据。

本回答被网友采纳
第3个回答  2018-07-16
大数据 Big Data, 据说源出自Alvin Toffler,上世纪70年代的作品《第三次浪潮》。数据已经被使用了十几年了,比如它们总是被用于各种分析,所以为什么说是「大数据」呢?主要是因为我们现在可用数据的数据量(Volume)、处理速度(Velocity)以及数据种类(Variety),所以它具有如下三个特点:三个特点:大容量、高速度、多种类。数据并不新,只是比之前大得多。
当然,大数据也有其缺陷。啪菠萝·毕加索说,大数据就是多,就是多。原来的设备存不下、算不动。Schönberger说,大数据,不是随机样本,而是所有数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。
世界刚刚来到一场变革的起点,它将影响各行各业以及每个人生活。 不过,很多人仍将大数据视为一个可以忽略的事情。以下二十个事实相信会让你对大数据的认识更具体一些:
1.数据量正在爆炸,过去两年生产的数据量比之前整个人类历史生产的数据还要多。
2.数据正以更快的速度猛增,到2020年,每人每秒将会生产1.7兆字节新信息。
3.到那时,累积数字信息量会从今天的4.4泽字节增长到约44泽字节。
4.我们每秒都在生产新数据。比如,每秒进行4万次搜索查询(仅谷歌),每天3.5次搜索,每年1.2万亿次搜索。
5.2015年8月,一天内有超过10亿人使用FB。
6.FB用户平均每分钟发送3125万条信息,观看277万条视频。
7.我们目睹了视频与图片数据量的巨增,仅每分钟上传至YouTube的视频就达300小时。
8.2015年,人们将会拍摄一万亿张照片,在线分享数以亿计的照片.到2017年,近80%的照片将由智能手机拍摄。
9.今年,14亿多部智能手机将满载能够搜集各种数据的传感器,更别提用户自己生产的数据了。
10.到2020年,全球将有超过61亿智能手机用户(超基本固话用户)。
11.五年内,世界将有超过500亿个智能连接设备,都被设计用来搜集、分析和分享数据。
12.到2020年,至少三分之一的数据将通过云端传输。
13.分布式计算机(使用云端的计算机网络来执行计算任务)非常真实。谷歌每天使用它,约有1千台计算机来回答单个搜索查询,耗时不超过0.2秒。
14.预测Hadoop(分布式计算机开源软件)市场将以复合年增长率58%增长。
15.估计显示,通过更好地吸收大数据,医疗保健每年能节约3千亿美元,相当于毎年削减1千美元的人均成本(男人、女人和小孩)。 16.白宫在大数据项目上的投入已超2亿美元。
17. 对一家典型的《财富》一千强公司来说,数据存取可能性增加10%,就会带来超过6500万美元的额外净收入。
18.充分开发大数据的零售商能将营业毛利提高60%。
19. 到2016年,73%的组织巳经投资或计划投资大数据。
20.我最喜欢的事实之一:现在,得到分析使用的数据还不到总量的0.5%,试想一下这里的潜力。
第4个回答  2019-04-15

"大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。

5V特性:

相似回答