首页
学习
活动
专区
工具
TVP
发布

实时流式计算

专栏作者
119
文章
181138
阅读量
39
订阅数
元数据管理平台对比预研 Atlas VS Datahub VS Openmetadata
大家好,我是独孤风。元数据管理平台层出不穷,但目前主流的还是Atlas、Datahub、Openmetadata三家,那么我们该如何选择呢?
用户6070864
2024-01-05
1K0
【开源项目推荐】Great Expectations—开源的数据质量工具
又到了本周的开源项目推荐。数据质量是企业进行数据治理非常重要的一个环节,高质量的数据对管理决策,业务支撑都有非常重要的作用。 只有持续的数据质量改进才能推动数据治理体系的完善,差劲的数据质量就如同顽固的疾病一样,如果不能得到及时的改善,最终可能会导致重大的问题。 近几年来,管理数据质量的工具层出不穷,但是能够全面的对企业数据质量进行分析与洞察的工具并不多见。 那么,有没有好用的开源的数据质量项目呢? 今天为大家推荐的开源项目,就是一个极为优秀的数据质量检查工具,开源的数据质量管理项目。让我们一起来看看吧~
用户6070864
2024-01-05
3410
【开源项目推荐】Apache Superset——最优秀的开源数据可视化与数据探索平台
数据可视化是数据领域一个非常重要的应用。而结合了数据可视化和数据探索功能的BI(商业智能)工具,更是被各大公司青睐。但是,由于数据可视化工具的开发成本过高,长期以来一直是商业化的BI工具处于垄断地位。 那么,有没有优秀的开源数据可视化与数据探索平台呢? 今天为大家推荐的开源项目,就是极为优秀的数据可视化项目,Github标星高达55K。让我们一起来看看吧~
用户6070864
2024-01-05
3380
【开源项目推荐】OpenMetadata——基于开放元数据的一体化数据治理平台
这几年数据治理爆火,但迟迟没有一个优秀的开源数据治理平台的出现。很多公司选择元数据管理平台作为基础,再构建数据质量,数据血缘等工具。
用户6070864
2023-12-21
1.1K0
【开源项目推荐】-支持GPT的智能数据库客户端与报表工具——Chat2DB
2023年是人工智能爆火的一年,ChatGPT为首的一系列的大模型的出现,让生成式人工智能彻底火了一把。但有人会说,GPT对于我们数据开发来说并没有什么作用啊?
用户6070864
2023-12-12
4930
Apache Paimon流式湖仓学习交流群成立
Apache Paimon是一个流式数据湖平台。致力于构建一个实时、高效的流式数据湖平台。这个项目采用了先进的流式计算技术,使企业能够实时处理和分析大量数据。Apache Paimon 的核心优势在于它对于大数据生态系统中流式处理的支持,尤其是在高并发和低延迟方面表现出色。
用户6070864
2023-12-01
2730
使用GPT4进行数据分析,竟然被他骗了
上周,OpenAI开发者大会上OpenAI发布了一系列震撼人心的功能。而最让我感兴趣的,就是GPT4的数据分析功能了。话不多说,赶紧上号体验一下。
用户6070864
2023-11-13
1370
OpenAI 首次开发者大会(GPT4全面开放,新模型,GPT 商店来了)
OpenAI 的首次开发者大会,于北京时间 11 月 7 日凌晨 02:00 开始,这45分钟的内容干货满满,并介绍了OpenAI未来的一些发展构想。
用户6070864
2023-11-08
3260
用户案例 | 蜀海供应链基于 Apache DolphinScheduler 的数据表血缘探索与跨大版本升级经验
蜀海供应链是集销售、研发、采购、生产、品保、仓储、运输、信息、金融为一体的餐饮供应链服务企业。2021年初,蜀海信息技术中心大数据技术研发团队开始测试用Apache DolphinScheduler作为数据中台和各业务产品项目的任务调度系统工具。本文主要分享了蜀海供应链在海豚早期旧版本实践过程中的探索创新和在跨大版本升级部署过程中的经验,希望对大家有所启发和帮助。
用户6070864
2023-09-09
5120
正常网络可用,网页版+APP——科大讯飞星火认知大模型使用指南
近一年的大模型发生了巨大的发展, 随着LLaMA开源,大模型的进展有了很大的飞跃。 虽然国内大模型和GPT4之间还有一定差距,但是使用性方面还是方便很多。 1、账号申请全流程 目前账号还是需要申请的,
用户6070864
2023-09-06
2.2K0
Apache DolphinScheduler 在大数据环境中的应用与调优
下午好,我叫李进勇,是政采云数据平台架构师,在政采云主要负责大数据底层架构和数据工程化方面,同时也是 Dolphinscheduler的PMC成员。今天我将重点分享关于Apache Dolphinscheduler 2.0.9版本中一些优秀的功能。选择这个主题的原因是因为在2.0.X版本的演进中,我们致力于打造一个稳定且功能强大的工作流编排调度平台,使得工作流编排和批处理调度变得更加稳定可靠,因此将此主题命名为“聚焦调度”。
用户6070864
2023-09-06
5590
Datahub稳定版本0.10.4安装指南(独孤风版本)
曾几何时,我在第一次安装JDK环境的时候也遇到了不小的麻烦,当时还有朋友就因为这个环境问题觉得自己根本不是编程的料,选择了放弃。当时有个段子说,“如果不是JDK环境没搞定,我一定是一个编程天才”。权当一笑,但是环境问题确实是个大问题。
用户6070864
2023-09-06
3970
开源元数据管理平台Datahub最新版本0.10.5——安装部署手册(附离线安装包)
开源元数据管理平台Datahub近期得到了飞速的发展。已经更新到了0.10.5的版本,来咨询我的小伙伴也越来越多,特别是安装过程有很多问题。本文经过和群里大伙伴的共同讨论,总结出安装部署Datahub最新版本的部署手册,希望能帮助到大家。
用户6070864
2023-09-06
8700
ChatGPT通过图灵测试,图灵测试要重写
近日《Nature》在一篇文章中称,ChatGPT 已经攻破了图灵测试,是时候要启用其他新的方法来评估人工智能技术了。
用户6070864
2023-08-09
5510
国家数据局的组建逻辑:如何为数据建市场?
一个科学、合理、适时的国家数据战略,对推动国家发展和提升治理能力具有重要意义。它关乎国家的战略布局和未来发展。
用户6070864
2023-08-09
1160
什么是数据管理,数据治理,数据中心,数据中台,数据湖?
数据管理是指组织对其整个数据生命周期进行的规划、执行和控制,以期最大化数据的价值。它涵盖了从数据采集、存储、处理到最终使用等全部过程。
用户6070864
2023-08-09
2970
一体化元数据管理平台——OpenMetadata入门宝典
大家好,我是独孤风,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,公众号大数据流动主理人。在最近的两年的时间里,因为公司的需求,还有大数据的发展趋势所在,我开始学习数据治理的相关知识。今天给大家分享一体化的元数据管理平台——OpenMetadata。
用户6070864
2023-08-09
1K0
数据治理是什么?该如何入门呢?
大家好,我是独孤风,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,公众号大数据流动主理人。
用户6070864
2023-08-09
2570
一句提示词生成整个代码库——Gpt Engineer神级项目开源(附演示视频)
在软件开发领域,一场巨大的革命正在开始。这一转变背后的驱动力正是GPT-Engineer,这是一个AI驱动的工具,它正在重新定义代码生成和定制。这个革命性的工具,能够根据您的规范生成整个代码库,有望成为开发人员工具包中不可或缺的一部分。
用户6070864
2023-08-09
3130
数据制造未来!制造业数据建设白皮书发布
十年来,我国数字经济取得了举世瞩目的发展成就,数字产业 化与产业数字化正在被大力推动,“云大物智移”正在成为企业当 前转型的必要方向,数据俨然成为企业不可或缺的生产要素,数据建设规划是企业发展规划中的重要环节,甚至成为战略规划,作为 企业发展的“折子工程”。数据建设包含了企业文化建设、企业基 础设施建设、企业数据人才建设、企业数据规范体系建设、企业数 据应用建设等,帮助企业建立从数据获取生产到数据消费利用的全 生命周期管理体系,使数据正式成为企业的资产被利用且产生价值。本次白皮书将针对制造型企业的数据建设,提出“数据诊断 - 行动方案”的解决思路,给出《数据建设成熟度评估模型》,模型 通过 9 大维度(企业文化、企业投入、组织人才、基础设施、业务 管理、组织协同、规范体系、数据质量及数据安全)判断企业当前 数据建设所处阶段,并针对每一阶段给出企业如何迈向下一阶段的 行动方案,旨在帮助企业进行数据建设规划,指明数据建设的方向。
用户6070864
2023-08-09
1830
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档