专栏首页大数据应用解读中科点击:关于大数据概念最全面的解读都在这了
原创

中科点击:关于大数据概念最全面的解读都在这了

随着大数据产业的迅猛发展,“大数据”三个字对我们来说早已经不再陌生,生活中我们也能经常在身边听到关于“大数据”的讨论,大数据已经代替互联网成为新时代的最热门的话题。虽然大数据已经无处不在,但很多人对于大数据的概念仍然很模糊,没有办法用一个准确的描述来形容大数据,今天,我们就将全网最受关注的大数据概念解读跟大家分享。

大数据概念的萌芽

“大数据”这个术语最早期的引用可追溯到apache org的开源项目Nutch。当时,大数据用来描述为更新网络搜索索引需要同时进行批量处理或分析的大量数据集。随着谷歌MapReduce和Google File System (GFS)的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。

早在1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。此外,数据又并非单纯指人们在互联网上发布的信息,全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,也产生了海量的数据信息。

此阶段为大数据概念的萌芽阶段,意味着大数据概念的诞生,但并没有一个准确的描述,只是一个关于大数据的朦胧印象。

大数据概念的活跃

随着大数据行业的发展,对于大数据的研究也逐渐深入,大数据开始正式走进公众视野,于是关于大数据概念的正式定义也纷纷出现。

2011年麦肯锡全球研究所对于大数据给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征;

2012年维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》指出,大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯;

维基百科中指出,大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间限制的数据集;

全球著名的管理咨询公司McKinsey则将数据规模超出传统数据库管理软件的获取、存储、管理以及分析能力的数据集称为大数据;

研究机构Gartner将大数据归纳为需要新处理模式才能增强决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产;

以上所有关于大数据的定义都是建立在大数据的特征之上,即大数据的5V特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。通过这些权威机构发布的大数据概念,让我们对于大数据有了全新的了解,与此同时随着大数据时代的到来,大数据应用的爆发,大数据的概念是否也需要从新描述呢?

重新定义大数据

就目前对大数据的定义而言,更多的是从数据本身以及技术层面的解读。行业术语叫巨量数据集合。不管是行业术语还是麦肯锡给出的定义,都是从大数据本身出发,从数据的特征与处理解读,对于一般人来说是比较难以理解的,也不便于流传和记忆的。大数据成为一种趋势,必将成为一种生活和商业模式,这是毋庸置疑的现状和未来。所以,我们时常在想,有没有一种定义能够让普罗大众很清晰明白地感知大数据,让即将进入或者有意从事这一行业的人直观地了解他,走近它。

作为大数据领域的专家,中科点击总裁彭作文先生结合自己多年的大数据从业经验以及对于大数据的独到见解,从大数据的实际价值出发,从新定义了大数据。“大数据是以海量多维数据为资产,价值挖掘为导向,集合数据思维、数据能力、数据应用的数据工程体系。”彭作文先生认为,大数据的价值不在于数据本身,而在于数据应用所释放的价值。不能单向地认为大数据是一种资产或者一种技术,而是一个综合性工程体系,这个工程体系里集合了数据思维、数据能力以及数据应用。只有将这三层完全融合,才是对大数据比较全面深刻的认识。

大数据之所以大,是因为要处理的数据量从样本数据变成了全量数据,从存量数据变成了流式数据,人们不得不接受数据的混杂性,而放弃对精准性的追求。从数据价值来说,不管是现在还是未来,数据已经是一种战略性资产,更是一种生产资料。而大数据的价值不单单体现在数据本身的价值,更是体现在数据的关联分析上,是一个系统性的工程,而不是一堆数据的简单集合。

大数据的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。大数据的意义不在于数据本身,而在于对数据的分析与应用,从而释放出数据所蕴含的巨大价值。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。大数据最重要是为国所用,为商所用,为民所用,这是根本,也是数据价值的本质。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 13张动图助你彻底看懂马尔科夫链、PCA和条件概率!

    [ 导读 ]马尔科夫链、主成分分析以及条件概率等概念,是计算机学生必学的知识点,然而理论的抽象性往往让学生很难深入地去体会和理解。而本文,将这些抽象的理论概念,...

    数据派THU
  • 仅靠一道简单的数学题,他就变成了Stack Overflow的数据科学家

    古语有云,“学好数理化,走遍天下都不怕。” 人工智能时代尤其如此。 比如,写上几句基础的数学概念,天上就能掉下一个工作来……这是真事。 学概率的时候,我们会反复...

    AI科技大本营
  • 「企业架构」企业架构框架图

    企业架构框架图是架构的分类方案(治理架构,业务架构,信息架构,技术架构,人力资本架构,安全架构,系统架构,软件架构,基础架构架构等)及其重要工件。企业架构框架可...

    首席架构师智库
  • 我们正在迎接一个无门槛的自动化AI时代 | 数据科学50人·陈雨强

    陈雨强,AI独角兽第四范式联合创始人、首席研究科学家。他与数据科学为伴,一路走来,从学习计算机,到搭建全球首个商用深度学习系统,再到立志做出世界上最好的Auto...

    DT数据侠
  • 数据科学难题,怎么解释到底什么是数据科学

    网络上没有任何文章比较和对比数据科学术语。所有类型的人都写了各种各样的文章,将他们的意见传达给任何愿意倾听的人。这几乎是压倒性的。

    首席架构师智库
  • 终于有人把数据、信息、算法、统计、概率和数据挖掘都讲明白了!

    导读:数据与数据应用中的许多概念彼此有着千丝万缕的联系,同时也有着概念上的偏重与区别,那我们可以先从数据应用领域中的常见概念先聊起。

    华章科技
  • 极简Python:数据分析与机器学习最小化知识库

    我们正处于一个数据科技(Data Technology,DT)时代。在这个时代,我们的一举一动都能在数据空间留下电子印记,于是海量的社交、电商、科研大数据扑面而...

    用户1682855
  • Wiztalk | 佘堃 Part 1 《人工智能的安全问题—AI的发展历程》

    人工智能的安全问题 Part 1 AI的发展历程 分享专家: 电子科技大学 佘堃教授 内容简介: 人工智能这一概念近些年出现频率越来越高,人们对于它有着充满...

    腾讯高校合作
  • 小猿看行业丨揭开智慧家庭大数据的神秘面纱

    导读 大数据无处不在,包括每个人敲击一下键盘,上传到网络的,都是大数据的一部分。可以这样说,我们生活中的任何细微举动,只要被传感设备感知,不论是成为文字描述,还...

    数据猿

扫码关注云+社区

领取腾讯云代金券