首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >The 4 V’s of Big Data

The 4 V’s of Big Data

作者头像
@阿诚
发布2020-09-01 15:35:41
1.3K0
发布2020-09-01 15:35:41
举报
文章被收录于专栏:Panda诚Panda诚

当今的普遍共识是大数据是有特定的属性的。在大多数大数据圈中,它们被称为四个V:体积,种类,速度和准确性(volume, variety, velocity, veracity.)。

Volume

大数据的主要特征是数量庞大。只关注最小存储单元是没有意义的,因为信息总量每年都在成倍增长。

Variety

随着越来越多的信息被数字化,多样性是技术上最有趣的发展之一。传统的数据类型(结构化数据)比如银行对帐单上,有日期,金额和时间。这些都是适合关系数据库的东西。

非结构化数据增强了结构化数据,在这些数据中放置了音频文件,MRI图像,网页,网络日志之类的东西(可以捕获和存储的任何东西),但没有元模型(一组规则)

非结构化数据是大数据中的基本概念。理解非结构化数据的最佳方法是将其与结构化数据进行比较。可以将结构化数据视为在一组规则中定义良好的数据。例如,金钱将始终是数字,并且至少具有两个小数点;名称以文字表示;日期遵循特定的模式。

另一方面,对于非结构化数据,没有任何规则。图片,录音-它们虽然可能有所不同,但都是基于人类的理解表达思想和想法的。大数据的目标之一是使用技术来获取非结构化数据并加以利用。

大数据的定义取决于是否可以在满足特定业务需求的时间内提取,处理和检查数据。对于一个公司或系统,大数据可能为50TB,也可能是10PB。

Veracity

准确性是指数据的可信赖性。我们可以信赖这些数据代表的事实吗?

Velocity

Velocity是传入数据处理的的频率。想一想每天每一分钟通过特定的电信运营商发送多少短信,Facebook状态更新或信用卡刷卡,你将对Velocity有所了解。像Amazon Web Services Kinesis这样的流应用程序就是处理数据速度的应用程序示例。

最后

任何大数据项目的最终目标应该是为公司进行所有分析创造某种价值。否则,就只是为了技术而执行一些技术任务。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-05-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Panda诚 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Volume
  • Variety
  • Veracity
  • Velocity
  • 最后
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档