首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据治理:白话打通对Atlas的理解

问题导读 1.Atlas是什么? 2.Atlas能干什么? 3.Atlas血统关系是什么? Atlas现在被企业使用的越来越多,我们可能听说过,但是具体它是什么,能干什么的,我们可能不清楚。 因此我们要解决第一个问题,Atlas是什么? Apache Atlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为Hadoop生态系统集群提供了包括数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能力。 上面我们或许听着比较懵圈,都是啥,元数据治理是啥?为啥要元数据治理?元数据不就是用来描述数据的数据,我们这么理解没有错的,不过这个是其中重要的一项。比如Hive的元数据,那是需要第三方数据库的,大多存储到mysql中。为啥又出来一个Atlas,它能管理Hive的元数据吗?别说,还真可以的。那为啥要用Atlas来管理。这就涉及到我们的第二个问题,Atlas能干什么?。 Atlas能干什么? 其实很多大数据组件都有元数据管理,比如: Hive保存在外部数据库中,比如Mysql Hadoop元数据保存在Namenode,元数据的存储格式:data/hadoopdata/目录下 name:元数据存储目录 namenode存储元数据的存储目录 Kakfa元数据一般保存在zookeeper中 等等以上,我们的元数据每个大数据组件都有保存的地方,为啥还需要Atlas。 上面元数据是为了功能而生,都是单独的系统,散落在各个组件中,而我们能不能把这些元数据统一管理,而且数据的变化我们也能看到那就更好了。而且如果能把我们整个集群的大数据组件的元数据我们都能看到,那就更好了。看到这些有什么好处?比如我们想找到Hive有哪些表,想查看我们数据是怎么来的。这时候数据管理工具就产生了--Atlas,用来管理元数据的平台。 我们知道了Atlas是什么,能干什么,可能是比较通透了。可是还不够详细,那么接下来我们看看Atlas有哪些功能,有什么特点。这里直接借用《大数据治理与安全从理论到开源实践》书中内容。

01
您找到你想要的搜索结果了吗?
是的
没有找到

如果明天失业了,该怎么办?

对于家里没矿、拆不了迁、拼不了爹妈爷奶的普通打工人,工作的首要目标就是养家糊口,为了生活,尤其是人到中年,上有老下有小,身上有车贷房贷,不敢生病,不敢请假。最近朋友圈看到很多关于寒意的内容,比如《我,阿里P7,找不到工作》,XX公司整部门裁员,应届生是重灾区等等。于是,一时间,“有工作”好像就已经是得天独厚的优势了,曾经经常在朋友圈吐槽公司、吐槽领导的人,甚至开始感激公司“不杀之恩,多谢收留”。开始打鸡血努力工作,保自己,保老板。于是,就在思考一个问题,如果我明天失业了,准备怎么办?有句古话叫“置之死地而后生”,提前想想这个问题,或许当这一天真的来了的时候,才不至于猝不及防,难以应对。

03

陈凯:大数据解读《爸爸去哪儿》第二季

这个时代学习能力是最重要的能力,而能够在周末的时间进行学习的人就更有竞争力。同时选择大数据这一方向来学习的人则是当今大数据时代最具有竞争力的人。 今天之所以选择用大数据解读爸爸去哪儿第二季这个话题是因为娱乐性的话题比较容易理解。大数据的概念起码要包含数据、技术和应用三个方面。因为有了越来越多的数据才有了大数据这一概念,才能够运用数据能够做很多的事情。这其中,最重要的就是互联网的发展。因为数量非常大而且有很多非结构化数据(文本、视音频等),这样的数据就必须用智能化的分析方法才能解决,因此这方面的大数据技术也更

05
领券