学习
实践
活动
工具
TVP
写文章
首页标签数据集成

#数据集成

轻量化、可视化、开放化的数据集成工具

走好信创落地“最后一公里”

用户5548425

随着近些年来内外部形势的剧烈变化及企业自身发展诉求,国内企业愈发重视基础软件的自主可控。特别是对于某些涉及国计民生的重点行业,监管层面也提出了非常明确的指导意见...

8940

开源共建 | 中国移动冯江涛:ChunJun(原FlinkX)在数据入湖中的应用

数栈DTinsight

ChunJun(原 FlinkX)是一个基于 Flink 提供易用、稳定、高效的批流统一的数据集成工具。2018 年 4 月,秉承着开源共享的理念,数栈技术团队...

9750

对于噪声数据理解以及Min-Max 规范化和 Score规范化(零-均值规范化)的实例【数据预处理】

上进小菜猪

内蒙古科技大学 · 学生 (已认证)

噪声数据(Noisy Data)就是无意义的数据,这个词通常作为损坏数据的同义词使用。

8530

【数据挖掘】数据预处理和运用概念以及对鸢尾花数据集分类的分位数图和直方图的实际运用

上进小菜猪

内蒙古科技大学 · 学生 (已认证)

大部分的机器学习模型所处理的都是特征,特征通常是输入变量所对应的可用于模型的数值表示。 大部分情况下,收集得到的数据需要经过预处理后才能够为算法所使用,预处理...

10130

数据导入与预处理-课程总结-04~06章

用户2225445

数据经过采集后通常会被存储到Word、Excel、JSON等文件或数据库中,从而为后期的预处理工作做好数据储备。数据获取是数据预处理的第一步操作,主要是从不同的...

7410

数据导入与预处理-课程总结-01~03章

用户2225445

备注:本文主要是课程总结,不做过多的拓展,如果需要详细了解,可以查看本专栏系列内容,专栏链接直达

5620

数据挖掘 韩家炜_数据挖掘的特点

全栈程序员站长

数据挖掘又称知识发现(KDD:Knowledge Discovery in Database),即“从数据中挖掘知识”。   丰富的数据以及对强有力的数据分析...

7750

数据导入与预处理-第6章-01数据集成

用户2225445

数据分析中需要的数据往往来自不同的途径,这些数据的格式、特点、质量千差万别,给数据分析或挖掘增加了难度。为提高数据分析的效率,多个数据源的数据需要合并到一个数据...

5920

Neo4j-APOC扩展与使用

用户2225445

备注:本文APOC是基于Neo4j3.5版本进行安装,原因在于本地电脑的Java版本为1.8

5620

ODS简介_医学ods是什么意思

全栈程序员站长

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最...

8530

生产管理软件的使用对生产效率的影响_新华erp生产管理软件

全栈程序员站长

生产计划除了为生产部门提供生产制造的依据,还关系采购计划、安全库存、订单交付等各环节,管理起来十分复杂。一款好用的生产计划管理软件,不仅能全面集成生产相关的业...

6870

一个支持实时分析的复杂业务系统架构设计

明月AI

最近接触到的一个开发项目,该项目的业务比较复杂,角色众多,关联系统也多,数据安全要求高,甲方希望系统是面向未来五到十年,数据分析要足够高效。

5640

【Techo Day腾讯技术开放日】数据仓库总结

蓦然

数据库(Database)是按照一定格式和数据结构在计算机保存数据的软件,属于物理层。

11510

ChunJun框架在数据还原上的探索和实践 | Hadoop Meetup精彩回顾

数栈DTinsight

ChunJun(原FlinkX) 是袋鼠云基于Flink 基座自研的数据集成框架,经过4年多的迭代,已经成为一个稳定,高效,易用的批流一体的数据集成工具,可实现...

8110

【愚公系列】2022年10月 基于WPF的智能制造MES系统框架-菜单栏的设计

愚公搬代码

MES系统为企业提供包括制造数据管理、计划排程管理、生产调度管理、库存管理、质量管理、人力资源管理、工作中心/设备管理、工具工装管理、采购管理、成本管理、项目看...

7520

【愚公系列】2022年10月 基于WPF的智能制造MES系统框架-菜单栏的设计

愚公搬代码

MES系统为企业提供包括制造数据管理、计划排程管理、生产调度管理、库存管理、质量管理、人力资源管理、工作中心/设备管理、工具工装管理、采购管理、成本管理、项目看...

8110

ChunJun框架在数据还原上的探索和实践 | Hadoop Meetup精彩回顾

数栈DTinsight

Hadoop 是 Apache 基金会旗下最知名的基础架构开源项目之一。自 2006 年诞生以来,逐步发展成为海量数据存储、处理最为重要的基础组件,形成了非常丰...

5000

2022爱分析· 地产科技厂商全景报告

爱分析ifenxi

地产科技,即房地产与科技的融合应用,是指利用人工智能、物联网、云计算、大数据、区块链、5G等数字化技术对房地产产业链上各环节进行业务流程重塑和模式创新,从而实现...

6220

AnalyticDB_分布式分析型数据库

全栈程序员站长

​ 分析型数据库AnalyticDB(原名 ADS)是阿里巴巴针对海量数据分析自主研发的实时高并发在线分析系统,可以针对万亿级别的数据进行多维度分析透视和业务探...

8120

ChunJun&OceanBase联合方案首次发布:构建一体化数据集成方案

数栈DTinsight

这是OceanBase&ChunJun联合解决方案的首次发布,将针对分库分表的实时数据集成、跨集群/租户的数据集成、不同数据源的实时数据集成、日志类型数据的全增...

8720

扫码关注腾讯云开发者

领取腾讯云代金券