专栏首页大数据应用解读中科点击:关于大数据概念最全面的解读都在这了
原创

中科点击:关于大数据概念最全面的解读都在这了

随着大数据产业的迅猛发展,“大数据”三个字对我们来说早已经不再陌生,生活中我们也能经常在身边听到关于“大数据”的讨论,大数据已经代替互联网成为新时代的最热门的话题。虽然大数据已经无处不在,但很多人对于大数据的概念仍然很模糊,没有办法用一个准确的描述来形容大数据,今天,我们就将全网最受关注的大数据概念解读跟大家分享。

大数据概念的萌芽

“大数据”这个术语最早期的引用可追溯到apache org的开源项目Nutch。当时,大数据用来描述为更新网络搜索索引需要同时进行批量处理或分析的大量数据集。随着谷歌MapReduce和Google File System (GFS)的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。

早在1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。此外,数据又并非单纯指人们在互联网上发布的信息,全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,也产生了海量的数据信息。

此阶段为大数据概念的萌芽阶段,意味着大数据概念的诞生,但并没有一个准确的描述,只是一个关于大数据的朦胧印象。

大数据概念的活跃

随着大数据行业的发展,对于大数据的研究也逐渐深入,大数据开始正式走进公众视野,于是关于大数据概念的正式定义也纷纷出现。

2011年麦肯锡全球研究所对于大数据给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征;

2012年维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》指出,大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯;

维基百科中指出,大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间限制的数据集;

全球著名的管理咨询公司McKinsey则将数据规模超出传统数据库管理软件的获取、存储、管理以及分析能力的数据集称为大数据;

研究机构Gartner将大数据归纳为需要新处理模式才能增强决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产;

以上所有关于大数据的定义都是建立在大数据的特征之上,即大数据的5V特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。通过这些权威机构发布的大数据概念,让我们对于大数据有了全新的了解,与此同时随着大数据时代的到来,大数据应用的爆发,大数据的概念是否也需要从新描述呢?

重新定义大数据

就目前对大数据的定义而言,更多的是从数据本身以及技术层面的解读。行业术语叫巨量数据集合。不管是行业术语还是麦肯锡给出的定义,都是从大数据本身出发,从数据的特征与处理解读,对于一般人来说是比较难以理解的,也不便于流传和记忆的。大数据成为一种趋势,必将成为一种生活和商业模式,这是毋庸置疑的现状和未来。所以,我们时常在想,有没有一种定义能够让普罗大众很清晰明白地感知大数据,让即将进入或者有意从事这一行业的人直观地了解他,走近它。

作为大数据领域的专家,中科点击总裁彭作文先生结合自己多年的大数据从业经验以及对于大数据的独到见解,从大数据的实际价值出发,从新定义了大数据。“大数据是以海量多维数据为资产,价值挖掘为导向,集合数据思维、数据能力、数据应用的数据工程体系。”彭作文先生认为,大数据的价值不在于数据本身,而在于数据应用所释放的价值。不能单向地认为大数据是一种资产或者一种技术,而是一个综合性工程体系,这个工程体系里集合了数据思维、数据能力以及数据应用。只有将这三层完全融合,才是对大数据比较全面深刻的认识。

大数据之所以大,是因为要处理的数据量从样本数据变成了全量数据,从存量数据变成了流式数据,人们不得不接受数据的混杂性,而放弃对精准性的追求。从数据价值来说,不管是现在还是未来,数据已经是一种战略性资产,更是一种生产资料。而大数据的价值不单单体现在数据本身的价值,更是体现在数据的关联分析上,是一个系统性的工程,而不是一堆数据的简单集合。

大数据的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。大数据的意义不在于数据本身,而在于对数据的分析与应用,从而释放出数据所蕴含的巨大价值。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。大数据最重要是为国所用,为商所用,为民所用,这是根本,也是数据价值的本质。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 中科点击:大数据的核心价值是在各领域的落地应用

    大数据,就是存储在各种存储介质中的海量的各种形态数据,大数据之“大”,不仅在于其“大容量”,更在于其“大价值”,并已成为国家的一种重要资源。建设现代化经济体系离...

    拼命三郎
  • 中科点击:大数据解决方案重在应用场景挖掘

    互联网移动互联网的高速发展,数据信息的爆炸式增长,将我们带到一个全新的大数据时代,一时间,“大数据”变成一个高大上的词汇,围绕“大数据”衍生出来的东西也越来越多...

    拼命三郎
  • 中科点击:如何快速打造一个大数据应用平台?

    创建大数据平台,是个系统性的工程,并不像简简单单开发一款APP一样,你要深度的了解当前的环境以后的发展。事实上,做大数据平台不是做大数据本身,而是寻找大数据与行...

    拼命三郎
  • 【案例】浅谈医学大数据是怎么回事?

    编者按:本文作者陈遵秋,美国俄勒冈州,健康科技大学,公共卫生预防系,美国统计协会认证统计分析师;陈漪伊,美国俄勒冈州,健康科技大学,公共卫生预防系,生物统计助理...

    小莹莹
  • 网站安全公司-数据安全风险分析

    现代信息化系统越来越普遍,但对于数据安全方面却有很多问题,数据完整性风险不仅影响信息的有效性,还影响信息正确性的保证。一些政府条例特别注重确保数据的准确性。如果...

    技术分享达人
  • 大数据社会的十三大具体应用场景

      美国NASA如何能提前预知各种天文奇观?风力发电机和创业者开店如何选址?如何才能准确预测并对气象灾害进行预警?包括在未来的城镇化建设过程中,如何打造智能城...

    腾讯研究院
  • #后疫情时代的新思考#“数 ”战“数”决将成为各行各业的普遍趋势丨数据猿公益策划

    2020年初,突如其来的新冠疫情打乱了正常的社会节奏,全国上下集体投入到了疫情防控攻坚战之中。

    数据猿
  • 安全的陷阱:警惕大数据壁垒化危害

      随着人们对大数据价值理解的深入,更多的公司将自身领域拓展至大数据层面。然而与高速发展相对应的是,数据管理行业急需的一系列数据使用标准及数据守则并没有被建立...

    腾讯研究院
  • 元数据的生死时速

    公司经营分析会提到家庭市场的重要性,我就问负责家庭模型的同事:去年做的家庭结构标签用得怎么样?然后同事给我拉出了下面这张表。

    用户1564362
  • 业界 | 苹果确认收购了一家斯坦福血统的暗数据分析公司

    AI科技评论了解,苹果近日收购了一家数据挖掘和机器学习公司LATTICE(网址Lattice.io)。这家公司的前身是斯坦福大学计算机学院的研究项目DeepDi...

    AI科技评论

扫码关注云+社区

领取腾讯云代金券