前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据的由来

大数据的由来

作者头像
用户1483438
修改2021-11-17 19:40:03
6450
修改2021-11-17 19:40:03
举报
文章被收录于专栏:大数据共享大数据共享

大数据概念的的兴起也就是最近不到10年的时间,我们在了解了数据的几个基本概念之后,我们再来看一下大数据出现的背景。数据量大。什么是数据?狭义上讲数据就是数值,也就是我们通过观察、实验或计算得出的结果;从广义上讲,数据的含义更加广阔,也可以是文字、图像、声音等。当前我们所说的数据一般是指广义上的数据。

初识大数据

什么是大数据?大数据的特点是什么?大数据与传统数据之间有什么关系?大数据与我们有什么关系?尽管许多书籍直接解释了大数据的概念和特征,但根据个人经验,如果我们首先了解数据的概念和特征,那么对我们来说,将更容易理解大数据。

有关数据的几个问题

什么是数据?从狭义上讲,数据是一个数值,它是通过观察,实验或计算获得的结果;从广义上讲,数据的含义更广泛,也可以是文本,图像,声音等。我们当前所指的数据通常指广义上的数据。

数据的特征是什么?数据类型很多(语言,文本,值,图像,音频和视频等),并且数据的质量也不均匀。真与假很难区分。数据存储媒体是不同的(口头传输,纸质书籍,数字磁盘)。数据的特征被简单总结。以下几句话:很多,凌乱,混乱。

数据做什么?数据本身的主要功能是记录事物及其发展。人们可以根据这些记录的数据对事物进行分析,并获得相关的规律和结果(例如基于实验数据的相应计算公式),并获得当前或将来事物的规则和结果做出相应的决策和行动。

大数据的起源

大数据概念的兴起在过去不到十年的时间里。在理解了数据的几个基本概念之后,让我们看一下大数据出现的背景。

关于数据的起源,早在远古时代,人们就已经在石头和树木上记录了相应的数据。后来,人们使用竹简,棉丝等来记录和传输数据。在这一阶段,数据的记录和分发非常困难。有限;纸张的出现和印刷的发明之后,数据的记录和传播首次取得了长足的进步,但此时的数据量仍然很小,传输速度相对较慢,传输范围较广。相对狭窄人们对数据的分析和使用非常有限;在诸如计算机和磁盘之类的存储介质问世之前,人们记录数据以及计算和分析数据的能力有了质的飞跃。随着互联网的出现和通信技术的不断进步,数据的产生和传播速度以及数据的传播范围迅速增加,并且数据呈现爆炸性增长。人们几乎可以实时了解世界上的所有重大事件,并且人们已经进入了所谓的大数据时代。

大数据的基本概念

大数据与传统数据之间的异同是什么?只是数量增加了吗?我们处理大数据的方法是否与传统数据相同?大数据与我们的生活之间有直接关系吗?

大数据与传统数据之间的异同是什么?现在更加认识的大数据特征是关于大数据“ 4V”的陈述,即大数据与传统数据之间的异同,即海量数据,各种数据类型,快速数据处理速度快,数据值密度低。

数据量(Volume)

数据类型(Variety)

处理方式(Velocity)

数据价值(Value)

传统资料

数据量少,增长率降低

单一数据类型,主要是数字和文本

手动计算和推导,独立处理,及时性低

值密度高,基本上所有有用的信息都被存储

大数据

数据量很大,并且数据量层呈指数增长

丰富的数据类型,很大一部分的视听数据

分布式处理,及时性高

价值密度低,需要从大量数据中挖掘价值

那么我们应该使用什么方法来处理这些数据呢?根据大数据和传统数据的特征,在处理这些海量数据时,我们的思维应有所变化。在《大数据时代:生活工作与思维的大变革》一书中指出,当我们处理大数据时,思维应该发生三个变化:全量而不是抽样,效率而不是精度,相关性因果关系。

全量而不是采样。在以前的数据存储和计算能力的限制下,通常在数据分析中使用采样方法。通过分析一些数据可以获得相应的结论,然后将其扩展到整个数据集。在大数据时代,数据存储和计算不再是瓶颈。可以将整个数据集用于全局数据分析,以快速获得相应的结果。

效率而不是准确性。在过去的抽样分析中,必须确保样本分析的准确性,以便在全局数据中得到提升,以免在全局数据中数据分析结果的误差会增大,这使得数据分析和验证更加麻烦效率低。在大数据时代,直接分析全局数据,分析结果的误差直接基于所有数据,并且可以在可接受的误差范围内直接使用分析结果,而不必担心分析误差的扩散。

相关性而非因果关系。在过去的数据分析中,分析的目的通常是了解事物背后发生的原理,但是在大数据时代,数据的因果关系并不那么重要。人们经常关注事物将如何发展,而不是为什么要发展数据。随着这种发展,事物之间的关联性变得更加重要。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档