腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
实时计算
专注于实时计算相关技术,Kafka,Flink,Storm,ES等等
专栏成员
举报
182
文章
343333
阅读量
51
订阅数
订阅专栏
申请加入专栏
全部文章(182)
大数据(55)
kafka(39)
编程算法(36)
sql(26)
apache(23)
java(20)
api(19)
python(18)
数据库(17)
开源(15)
spark(13)
http(12)
hadoop(12)
hive(12)
flink(12)
数据处理(10)
windows(10)
数据(10)
node.js(9)
云计算(9)
scala(8)
TDSQL MySQL 版(8)
数据分析(8)
hbase(8)
数据管理(7)
bash(6)
unix(6)
文件存储(6)
存储(6)
zookeeper(6)
github(5)
jar(5)
神经网络(5)
mapreduce(5)
https(5)
机器学习(4)
git(4)
maven(4)
linux(4)
bash 指令(4)
容器镜像服务(4)
深度学习(4)
批量计算(4)
网站(4)
分布式(4)
缓存(4)
jdk(4)
线性回归(4)
Elasticsearch Service(4)
数据湖(4)
工具(4)
php(3)
xml(3)
android(3)
云数据库 Redis®(3)
打包(3)
centos(3)
SSL 证书(3)
企业(3)
网络安全(3)
yum(3)
数据结构(3)
虚拟化(3)
可视化(3)
入门(3)
json(2)
eclipse(2)
全文检索(2)
lucene/solr(2)
spring(2)
命令行工具(2)
人工智能(2)
电商(2)
容器(2)
kubernetes(2)
shell(2)
jvm(2)
gradle(2)
kerberos(2)
数据可视化(2)
微服务(2)
任务调度(2)
部署(2)
管理(2)
配置(2)
搜索(2)
费用中心(1)
对象存储(1)
c++(1)
bootstrap(1)
html(1)
jquery(1)
sqlite(1)
oracle(1)
ide(1)
搜索引擎(1)
专用宿主机(1)
日志服务(1)
消息队列 CMQ 版(1)
腾讯云测试服务(1)
mongodb(1)
数据安全(1)
yarn(1)
自动化(1)
面向对象编程(1)
监督学习(1)
推荐系统(1)
grep(1)
tcp/ip(1)
spring cloud(1)
uml(1)
无监督学习(1)
安全(1)
物联网(1)
系统架构(1)
架构设计(1)
腾讯云开发者社区(1)
es(1)
实时数仓(1)
智能推荐平台(1)
add(1)
admin(1)
assets(1)
count(1)
file(1)
gpt(1)
it(1)
linkedin(1)
map(1)
max(1)
repository(1)
root(1)
service(1)
stack(1)
sudo(1)
版本控制(1)
测试(1)
服务(1)
架构(1)
教程(1)
解决方案(1)
模型(1)
数据中心(1)
搜索文章
搜索
搜索
关闭
【开源项目推荐】——纯中文本地GPT知识库搭建项目.assets
assets
gpt
部署
模型
开源
又到了本周的开源项目推荐。近一年多的时间,人工智能迎来了大爆发。GPT相关的大模型的发展让很多领域都发生了巨大的变化。 但是虽然GPT的自然语言识别功能异常的强大,但回答给我们的知识内容并不尽如人意。那么,有没有可以在本地部署搭建的AI知识库项目呢? 今天为大家推荐的就是一个纯中文本地GPT知识库搭建项目,虽然刚刚开源不到半年的时间,标星已经达到了8.8K, 让我们一起来看看吧~
大数据流动
2024-01-17
3.1K
0
【开源项目】轻量元数据管理解决方案——Marquez
数据管理
搜索
开源
解决方案
数据
又到了本周的开源项目推荐。最近推荐的元数据管理项目很多,但是很多元数据管理平台的功能复杂难用。 那么有没有轻量一点的元数据管理项目呢? 今天为大家推荐的开源项目,就是一个轻量级的元数据管理工具。虽然轻量,但是元数据的收集、展示、数据血缘等功能都是支持的。 让我们一起来看看吧~
大数据流动
2024-01-11
990
0
元数据管理平台对比预研 Atlas VS Datahub VS Openmetadata
开源
架构
数据
数据管理
搜索
大家好,我是独孤风。元数据管理平台层出不穷,但目前主流的还是Atlas、Datahub、Openmetadata三家,那么我们该如何选择呢?
大数据流动
2024-01-10
2.4K
0
【开源项目推荐】Great Expectations—开源的数据质量工具
腾讯云开发者社区
又到了本周的开源项目推荐。数据质量是企业进行数据治理非常重要的一个环节,高质量的数据对管理决策,业务支撑都有非常重要的作用。 只有持续的数据质量改进才能推动数据治理体系的完善,差劲的数据质量就如同顽固的疾病一样,如果不能得到及时的改善,最终可能会导致重大的问题。 近几年来,管理数据质量的工具层出不穷,但是能够全面的对企业数据质量进行分析与洞察的工具并不多见。 那么,有没有好用的开源的数据质量项目呢? 今天为大家推荐的开源项目,就是一个极为优秀的数据质量检查工具,开源的数据质量管理项目。让我们一起来看看吧~
大数据流动
2024-01-06
1.7K
0
【Datahub系列教程】Datahub入门必学——DatahubCLI之Docker命令详解
容器镜像服务
容器
教程
配置
入门
大家好,我是独孤风,今天的元数据管理平台Datahub的系列教程,我们来聊一下Datahub CLI。也就是Datahub的客户端。
大数据流动
2023-12-29
1.1K
0
【开源项目推荐】OpenMetadata——基于开放元数据的一体化数据治理平台
开源
测试
服务
工具
数据
这几年数据治理爆火,但迟迟没有一个优秀的开源数据治理平台的出现。很多公司选择元数据管理平台作为基础,再构建数据质量,数据血缘等工具。
大数据流动
2023-12-26
2.6K
0
最新版本——Hadoop3.3.6单机版完全部署指南
存储
大数据
部署
配置
数据
本文基于最新的 Hadoop 3.3.6 的版本编写,带大家通过单机版充分了解 Apache Hadoop 的使用。本文更强调实践,实践是大数据学习的重要环节,也能在实践中对该技术有更深的理解,所以一些理论知识建议大家多阅读相关的书籍(都在资料包中)。
大数据流动
2023-12-07
1.1K
0
【开源项目推荐】通用SQL数据血缘分析工具——Sqllineage
sql
开源
工具
可视化
数据
开源项目不仅促进了技术的发展和普及,还为全球范围内的开发者和用户社区建立了一个共享知识、协作和创新的平台。站在巨人的肩膀上才能看的更远,我们平时也应该多多关注开源项目,不仅学习其丰富的知识,也要找机会为开源事业做出自己的贡献。
大数据流动
2023-12-06
719
0
【开源项目推荐】通用SQL数据血缘分析工具——Sqllineage
sql
开源
工具
可视化
数据
开源项目不仅促进了技术的发展和普及,还为全球范围内的开发者和用户社区建立了一个共享知识、协作和创新的平台。站在巨人的肩膀上才能看的更远,我们平时也应该多多关注开源项目,不仅学习其丰富的知识,也要找机会为开源事业做出自己的贡献。
大数据流动
2023-12-06
817
0
【开源项目推荐】通用SQL数据血缘分析工具——Sqllineage
sql
开源
工具
可视化
数据
开源项目不仅促进了技术的发展和普及,还为全球范围内的开发者和用户社区建立了一个共享知识、协作和创新的平台。站在巨人的肩膀上才能看的更远,我们平时也应该多多关注开源项目,不仅学习其丰富的知识,也要找机会为开源事业做出自己的贡献。
大数据流动
2023-12-06
4.5K
0
什么是数据管理,数据治理,数据中心,数据中台,数据湖?
企业
数据湖
数据
数据管理
数据中心
数据管理是指组织对其整个数据生命周期进行的规划、执行和控制,以期最大化数据的价值。它涵盖了从数据采集、存储、处理到最终使用等全部过程。
大数据流动
2023-07-21
1.1K
0
一体化元数据管理平台——OpenMetadata入门宝典
开源
大数据
入门
数据
数据管理
大家好,我是独孤风,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,公众号大数据流动主理人。在最近的两年的时间里,因为公司的需求,还有大数据的发展趋势所在,我开始学习数据治理的相关知识。今天给大家分享一体化的元数据管理平台——OpenMetadata。
大数据流动
2023-07-21
2.4K
1
数据治理是什么?该如何入门呢?
企业
管理
入门
数据
数据管理
大家好,我是独孤风,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,公众号大数据流动主理人。
大数据流动
2023-07-21
603
0
Hadoop生态元数据管理平台——Atlas2.3.0发布!
容器镜像服务
hive
kafka
apache
hadoop
大家好,我是独孤风。 今天我们来聊一下另一个元数据管理平台Apache Atlas。Atlas其实有一些年头了,是在2015年的时候就开源。
大数据流动
2023-01-13
938
0
聊聊Hive数据血缘——从Atlas没有列级血缘的Bug讲起
apache
hadoop
sql
大数据
编程算法
前几天,Datahub提供了最新的字段级别数据血缘功能,很多朋友迫不及待想对比一下Datahub的字段级血缘与Atlas的区别。
大数据流动
2022-11-23
1.9K
0
Datahub新版本0.9.1更新,列级别数据血缘功能发布!
大数据
编程算法
近期Datahub进行了一次大的版本更新,从0.9版本以后Datahub也正式发布了列级别数据血缘的功能。
大数据流动
2022-11-14
2.1K
0
2022,数据科学与数据治理项目全纪录
数据湖
大数据
编程算法
机器学习
神经网络
2022年已过去一半多的时间了。这半年多,我们重点关注了LinkedIn Datahub、Atlas等元数据管理工具,了解了他们在数据治理领域的作用。
大数据流动
2022-10-31
548
0
企业级数据治理工作怎么开展?Datahub这样做
数据分析
大数据
大数据发展到今天,扮演了越来越重要的作用。数据可以为各种组织和企业提供关键决策的支持,也可以通过数据分析帮助发现更多的有价值的东西,如商机、风险等等。
大数据流动
2022-09-19
2.4K
0
滴滴被罚,数据安全该怎么做?——大数据安全入门宝典
kerberos
数据安全
数据库
数据处理
经查实,滴滴全球股份有限公司违反《网络安全法》《数据安全法》《个人信息保护法》的违法违规行为事实清楚、证据确凿、情节严重、性质恶劣。
大数据流动
2022-09-16
585
0
一、大数据技术
大数据
编程算法
本文为第一课(开篇)。在后续我也将按照自己积累的经验和学习群大家的讨论内容对后续的内容进行不断的整理。也感谢所有学习群群友的帮助,路漫漫,在数据治理的道路上让我们一起并肩前行。
大数据流动
2022-09-16
437
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档