用户6070864

LV0
发表了文章

数据治理之元数据管理的利器——Atlas入门宝典

随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是...

用户6070864
发表了文章

Flink 1.14.0 内存优化你不懂?跟着土哥走就对了(万字长文+参数调优)

自从写 Flink 系列文章,收到了太多读者的私信,希望我不断更新完善 Flink 专栏,为此,土哥还专门创建了一个文档,用来记录粉丝和读者在使用 Flink ...

用户6070864
发表了文章

Github 29K Star的开源对象存储方案——Minio入门宝典

对象存储不是什么新技术了,但是从来都没有被替代掉。为什么?在这个大数据发展迅速地时代,数据已经不单单是简单的文本数据了,每天有大量的图片,视频数据产生,在短视频...

用户6070864
发表了文章

万字长文|大数据学前准备之Linux入门笔记(附资料)

对于大数据学习而言,Linux运维可以说是必备的技能。可以不研究的过于高深,但是基本的操作和使用一定要熟练。Linux的学习需要大量的实践,本文从linux的基...

用户6070864
发表了文章

万字长文|Hadoop入门笔记(附资料)

大数据迅速发展,但是Hadoop的基础地位一直没有改变。理解并掌握Hadoop相关知识对于之后的相关组件学习有着地基的作用。本文整理了Hadoop基础理论知识与...

用户6070864
发表了文章

大数据最后一公里——2021年五大开源数据可视化BI方案对比

个人非常喜欢这种说法,最后一公里不是说目标全部达成,而是把整个路程从头到尾走了一遍。

用户6070864
发表了文章

非结构化数据怎么存?——开源对象存储方案介绍

过去的相当长的一段时间里,商用对象存储占据了市场上的大量的份额。国外的Amazon S3,国内的阿里云OSS都成为了大多数公司的选择。但是构建一个企业级的数据湖...

用户6070864
发表了文章

(三、四)Superset 1.3图表篇——透视表-Pivot Table

本系列文章基于Superset 1.3.0版本。1.3.0版本目前支持分布,趋势,地理等等类型共59张图表。本次1.3版本的更新图表有了一些新的变化,而之前也一...

用户6070864
发表了文章

数据湖搭建指南——几个核心问题

自 2010 年首次提出“数据湖”一词以来,采用数据湖架构的组织数量呈指数级增长。它们支持多种分析功能,从数据的基本 SQL 查询到实时分析,再到机器学习。

用户6070864
发表了文章

(二)Superset 1.3图表篇——Time-series Table

本系列文章基于Superset 1.3.0版本。1.3.0版本目前支持分布,趋势,地理等等类型共59张图表。本次1.3版本的更新图表有了一些新的变化,而之前也一...

用户6070864
发表了文章

DorisDB升级为StarRocks,全面开源!

在过去相当长的一段时间,对于ClickHouse 与 DorisDB的性能之争一直经久不息。

用户6070864
发表了文章

(一)Superset 1.3图表篇——Table

本系列文章基于Superset 1.3.0版本。1.3.0版本目前支持分布,趋势,地理等等类型共59张图表。本次1.3版本的更新图表有了一些新的变化,而之前也一...

用户6070864
发表了文章

当Atlas遇见Flink——Apache Atlas 2.2.0发布!

距离上次atlas发布新版本已经有一年的时间了,但是这一年元数据管理平台的发展一直没有停止。Datahub,Amundsen等等,都在不断的更新着自己的版本。但...

用户6070864
发表了文章

数据治理实践:元数据管理架构的演变

近几年来数据的量级在疯狂的增长,由此带来了系列的问题。作为对人工智能团队的数据支撑,我们听到的最多的质疑是 “正确的数据集”,他们需要正确的数据用于他们的分析。...

用户6070864
发表了文章

Apache Superset 1.2.0教程 (二)——快速入门(可视化王者英雄数据)

superset是通过SQLAlchemy连接数据库的。通过官方文档找到mysql的连接方式。

用户6070864
发表了文章

Apache Superset 1.2.0教程 (一)—— 安装(Windows版)

Apache Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard,为数...

用户6070864
发表了文章

Datahub 0.8.5发布! 通用的元数据搜索和发现工具

近期Datahub 发布了最新的版本0.8.5,作为LinkedIn开源的通用的元数据搜索和发现工具。Datahub近一年来有了巨大的发展,也成为了很多公司进行...

用户6070864
发表了文章

前沿 | 流批一体的一些想法

❝每家数字化企业在目前遇到流批一体概念的时候,都会对这个概念抱有一些疑问,到底什么是流批一体?这个概念的来源?这个概念能为用户、开发人员以及企业带来什么样的好...

用户6070864
发表了文章

Atlas 2.1.0 实践(4)—— 权限控制

在atlas-application.properties配置文件中,可以设置不同权限的开关。

用户6070864
发表了文章

Atlas 2.1.0 实践(1)—— 编译Atlas

为什么要做数据治理?业务繁多,数据繁多,业务数据不断迭代。人员流动,文档不全,逻辑不清楚,对于数据很难直观理解,后期很难维护。

用户6070864

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券