专栏首页加米谷大数据大数据入门须知的51个大数据术语(2)

大数据入门须知的51个大数据术语(2)

G

GPU加速的数据库:

提取流数据所需的数据库。

图分析:

一种组织和可视化集合中不同数据点之间关系的方法。

H

Hadoop:

一种用于处理和存储大数据的编程框架,尤其是在分布式计算环境中。

I

Ingestion摄取:

从许多不同来源获取流数据。

M

MapReduce:

一种数据处理模型,该模型在Map阶段对数据进行过滤和排序,然后对该数据执行功能,并在Reduce阶段返回输出。

Munging:

手动将数据从一种原始格式转换或映射为另一种格式以便更方便使用的过程。

N

正态分布:

表示大量随机变量的概率的通用图,其中,随着数据集的增加,这些变量趋于正态。也称为高斯分布或钟形曲线。

规范化:

将数据组织到表中的过程,以便使用数据库的结果始终是明确的和预期的。

P

解析:

将数据(例如字符串)划分为较小的部分以进行分析。

永久性存储:

一个不变的位置,例如磁盘,在创建数据的过程结束后将数据保存在该位置。

Python:

一种通用的编程语言,强调代码的可读性,以允许程序员使用较少的代码行来表达其概念。

R

R:

一种主要用于数据可视化和预测分析的开源语言。

实时流处理:

一种模型,可通过并行使用机器来分析数据序列,但功能有所减少。

关系数据库管理系统(RDBMS):

一种系统,用于管理,捕获和分析基于称为关系的共享属性进行分组的数据。

弹性分布式数据集:

Apache Spark抽象数据的主要方式,其中数据以容错的方式存储在多台计算机上。

S

碎片:

数据库的单个分区。

智能数据:

经过格式化的数字信息,可以在收集点上对其进行操作,然后再发送到下游分析平台以进行进一步的数据合并和分析。

流处理:

数据的实时处理。数据被连续,同时处理并逐记录进行处理。

结构化数据:

具有高度组织性的信息。

T

分类法:

根据预定系统对数据进行分类,并使用生成的目录来提供易于访问和检索的概念框架。

遥测:

远程获取有关对象的信息(例如,从汽车,智能手机,医疗设备或IoT设备)。

转换:

将数据从一种格式转换为另一种格式。

u

非结构化数据:

没有预定义数据模型或未按预定义方式组织的数据。

V

可视化:

分析数据并以可读的图形格式(例如图表或图形)表示数据的过程。

Z

区域:

数据湖中用于特定,明确定义目的的不同区域。

本文分享自微信公众号 - 加米谷大数据(DtinoneBD)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-01-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 关于大数据方面的核心技术了解一下

    大数据技术主要分为下面几个方面:数据采集与预处理、数据存储、数据清洗、数据查询分析和数据可视化

    加米谷大数据
  • 大数据的三类核心技术

    Flume NG实时日志收集系统,支持在日志系统中定制各类数据发送方,用于收集数据,同时,对数据进行简单处理;

    加米谷大数据
  • 大数据驱动营销14条营销法则

    “大多数公司的明智决策是数据分析和人类判断平衡后的结果。”以下14条经验法则,可以保证数据透明,有效进行数据驱动营销。

    加米谷大数据
  • 发改委答记者问:中国将于2018年前建成国家政府数据统一开放门户

    大数据文摘
  • 大数据24小时 | 云计算“老党”合作Gartner“新秀” 汇冠股份8亿元抢滩教育大数据“蓝海”

    <数据猿导读> 百度宣布投资美国ZestFinance公司 用大数据+人工智能实现精准信用评分;汇冠股份拟8.06亿元恒峰信息100%股份,抢滩教育大数据“蓝海...

    数据猿
  • 七种数据分析领域中最为人称道的降维方法

    近来由于数据记录和属性规模的急剧增长,大数据处理平台和并行数据分析算法也随之出现。于此同时,这也推动了数据降维处理的应用。实际上,数据量有时过犹不及。有时在数...

    小莹莹
  • 上海联通“沃+”开放数据应用大赛全网开战

    上海联通“沃+”开放数据应用大赛全网开战 首次开放50万用户脱敏数据 打造DT时代智慧应用 中国最有价值的大数据资源在哪里?答案可能是在通信运营商。三大运营商记...

    小莹莹
  • 为什么这么多人都想学大数据?宁可放弃本职工作也要转行学习

    大数据(big data,mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。

    用户4151968
  • 浅谈大数据应用研究的3个V

    To knowledge是目标,手段还是mining,俗称数据民工。每当大家讲到大数据,都会不约而同的提到大数据几个V的定义:Volume,Variety,Ve...

    腾讯大数据
  • 国家信息中心发布《2017中国大数据发展报告》

    数据猿导读 为帮助相关政府部门和社会各界更好地发展大数据产业,国家信息中心联合南海大数据应用研究院发布了2017《中国大数据发展报告》。该报告是业界首部完全基于...

    数据猿

扫码关注云+社区

领取腾讯云代金券