大数据(Big data)

文章目录

百度百科版本

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):

  1. Volume(大量)
  2. Velocity(高速)
  3. Variety(多样)
  4. Value(低价值密度)
  5. Veracity(真实性)

查看详情

维基百科版本

大数据是一个术语,用于指传统数据处理应用软件过于庞大或复杂的数据集,以便充分处理。具有许多情况(行)的数据提供更大的统计功率,而具有更高复杂度(更多属性或列)的数据可能导致更高的错误发现率。

大数据挑战包括捕获数据,数据存储,数据分析,搜索,共享,传输,可视化,查询,更新,信息隐私 和数据源。

大数据最初与三个关键概念相关联:大量,多样和及时。后来归因于大数据的其他概念是准确性(即 数据中有多少噪声)和价值。

查看详情

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 如何进行Flink项目构建,快速开发Flink应用程序?

    Flink应用项目可以使用Maven或SBT来构建项目,Flink针对这些构建工具提供了相应项目模板。 Maven模板命令如下,我们只需要根据提示输入应用项目...

    chaplinthink
  • 个推CTO安森:我所理解的数据中台

    在前面两篇文章(《数据智能时代来临:本质及技术体系要求》和《多维度分析系统的选型方法》)之中,我们概括性地阐述了对于数据智能的理解,并根据工作中团队涉及到的多维...

    AI科技大本营
  • 李伟坚(Excel催化剂):带你全面认识《Excel催化剂》系列功能

    本次要介绍的是一款名叫《Excel催化剂》的 Excel 插件,也是目前国内技术含最高的 Excel 插件,共计80大类300个细分功能、180个自定义函数,涉...

    寒树Office与RPA
  • Spark读取和存储HDFS上的数据

    本篇来介绍一下通过Spark来读取和HDFS上的数据,主要包含四方面的内容:将RDD写入HDFS、读取HDFS上的文件、将HDFS上的文件添加到Driver、判...

    石晓文
  • 不想做技术总监的项目经理,不是好程序员

    请看我上文十年风雨,一个普通程序员的成长之路(七)膨胀、骄傲,程序员转项目经理的原罪

    IT大咖说
  • Google 返华前,得先说清楚和美军什么关系

    互联网行业有三大幻觉流传甚广 —— WP 崛起、索尼倒闭、谷歌返华。WP 早就再无翻身机会,索尼倒闭也已沦为一句玩笑。而谷歌返华,每年都是风潮之后一声叹息。

    HyperAI超神经
  • 2019 第五届「四维图新杯」,地信创新大赛,实打实奖金 10w+!

    与往届「四维图新杯」创新大赛不同的是,本届大赛将选题进一步扩展,要求选手以数字地图、位置大数据领域为创新方向,进行行业跨界、技术融合的创新设计即可。这一制度不仅...

    AI研习社
  • 理解灭霸 | 手把手教你科学避开小长假出游高峰

    场景描述:将 AI 技术如计算机视觉、语音识别、自然语言处理、大数据分析等应用到旅游服务业中,一方面可帮助游客减少不必要的时间与金钱浪费,另一方面,可提升景区服...

    HyperAI超神经
  • IEEE Fellow 2020揭榜,逾七十位华人入选

    今年的入选大咖有不少的熟悉面孔,如前腾讯AI实验室负责人张潼、京东AI负责人周伯文、百度商业智能实验室主任熊辉等。

    AiTechYun
  • 【金猿案例展】中国银联:以内外联动的数据竞赛驱动企业数字化转型

    伴随着前沿技术的不断成熟和云端迁移的趋势,处于银行卡业务核心枢纽地位的中国银联希望通过打造常规性、延续性、品牌性的数据科学竞赛促进内外协同创新,持续引领金融领域...

    数据猿

扫码关注云+社区

领取腾讯云代金券