有奖捉虫:办公协同&微信生态&物联网文档专题 HOT
D J K L R S T X Y Z

D

大数据处理套件

大数据处理套件(Tencent Big Data Suite,TBDS)是基于腾讯多年海量数据处理经验,对外提供的可靠、安全、易用的大数据处理平台。您可以借助 TBDS 在公有云、私有云、非云化环境,根据不同数据处理需求选择合适的大数据分析引擎和相应的实时数据开发、离线数据开发以及算法开发服务,来构建您的数据仓库、用户画像、精准推荐、风险管控等大数据应用服务。

J

机器学习

  • 让数据科学家和算法工程师提供更棒体验的机器学习平台,通过拖拽式任务流设计,灵活多变的运行模式,丰富的内置机器学习算法,支持多种机器学习框架, 并提供可视化效果,同时还有强大的团队协作和分享能力,支持多种场景下的多实例调度, 让用户享受机器学习的乐趣。
  • 在联邦学习中,机器学习指专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身性能的学习过程。
  • 在新能源监控与转发平台中,机器学习指人工智能科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。

角色

数据开发治理平台 WeData 提供的角色包括超级管理员、空间管理员、数据科学家、运维工程师、普通成员等。

K

Kerberos

一种网络认证协议,用于验证用户或服务的身份,并授予其访问系统资源的权限。其使用密钥来保护通信,防止未经授权的访问和攻击。Kerberos广泛应用于大型企业和组织中,以保护其网络和系统资源的安全。

L

离线数据接入

多种数据源之间的灵活、快速集成,从而实现结构化、半结构化数据源之间的任意传输。

R

Ranger

一种开源的安全管理框架,用于管理大数据平台中的访问控制和安全策略。Ranger支持对多种大数据平台进行访问控制和安全管理,并提供了一个集中式的管理界面,可以简化访问控制和安全管理的过程,同时支持审计和报告功能,以便于监控系统安全和合规性。

任务调度

腾讯自研的任务调度系统,具有毫秒级任务下发,高可靠的特性,同时支持插件式扩展任务类型。

S

实时数据接入

支持多源异构数据实时接入大数据平台,高效实时的数据分发和实时处理。

数据仓库

一个面向企业的数据存储系统,用于支持企业的决策和分析。

数据地图

业务数据可视化展示,可共享、协作数据资产。

数据分析

提供简单的 SQL 查询功能,可以将 SQL 语句转换为 MapReduce/Spark 任务运行,进行在线 Scala、Python、SQL 脚本调试。

数据湖

一个存储海量原始数据的存储系统,可以存储结构化、半结构化和非结构化的数据。

数据血缘

数据产生的链路或者路径,例如通过数据 A 数据 B 产生了数据 C,那么 C 的父血缘就是 A 和 B,反之亦然。在大数据套件中描述数据“父子”关系,以思维导图形式展现了数据变化影响和数据生产溯源,清晰刻画表与表之间、任务与任务之间的关系。
在a) 统一元数据平台(Unified MetaData Platform,UDP)中,是指由 SQL 语句构成的数据来源与去向的关系表达,指数据在产生、处理、流转到消亡过程中,数据之间形成的一种类似于人类社会血缘关系的关系。

数据中台

数据中台是指在企业内部建立的一个数据服务平台,旨在将企业内部的各种数据资源进行整合和管理,提供数据服务和数据产品,支持企业的业务经营和决策。

数据质量

提供内置规则和自定义规则,对数据质量进行检测,通过数据质量全息图对数据质量健康度进行实时监控,进而实现数据质量缺陷定位、追溯提供决策支撑。

数据字典

  • 在大数据处理套件中,对数据的数据项、数据结构、数据存储等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明,使用数据字典为简单的建模项目。简而言之,数据字典是描述数据的信息集合,是对系统中使用的所有数据元素的定义的集合。
  • 在腾讯云 BI 中,字典即数据字典(Data dictionary),是对数据库字段进行说明和修饰的工具,在 BI 系统里经常用于对数据库字段进行解释,例如,源表字段中记录字段"级别"的值可能为 "0,1,2,3",但是这些值无法被解读,那么我们可以建立一个字典表,将“0”和“1”定义为“基层员工”,“2”定义为“中级干部”,“3”定义为“高级干部”。

T

TBDS

参见 大数据处理套件

X

项目

  • 在大数据处理套件中,项目是大数据平台所有资源管理的基础,所有应用系统上线,都必须运行在分配好的项目之内,项目可以认为是一个大数据开发项目,也可以按照组织部门逻辑划分项目。项目包含唯一的资源队列,包括 CPU、内存、存储空间等,不同资源队列之间分配优先级。
  • 在材料研究平台中,项目是 MRP 用来管理人员、实验、计算资源的基本单元。一个主账号可创建多个项目,一个子账号也可同时加入多个项目。
  • 在云数据库 KeeWiDB 中,是为了让开发商更好的管理云产品而开发的功能,该功能主要以项目为单位来进行,通过将各个云产品分别分配到各个项目中来实现项目管理。

Y

云原生

一种新兴的软件开发和部署方式,其应用程序可以更好地适应云环境中的动态性、弹性和可伸缩性等特点,从而提高应用程序的可靠性、可用性和可维护性。

Z

资源

  • 在大数据处理套件中,指包括计算资源和存储资源,计算资源是 yarn 资源可以调度分配 CPU 和内存资源;存储资源是 HDFS 的存储空间。
  • 在金融资源聚合平台中,指作为营销奖品发放的线上物料。

资源池

yarn 分配指定资源队列,提供计算任务时需要的资源。