首页
学习
活动
专区
工具
TVP
发布

A2Data

专栏作者
373
文章
384163
阅读量
30
订阅数
Ambari离线安装大数据集群
Centos 最小化安装:各个节点进行:网络配置(Nat 模式且可以共享主机网络)
DataScience
2021-01-18
2.2K0
[原创]-数据仓库ETL开发
ETL是数据仓库的后台,主要包含抽取、清洗、规范化、提交四个步骤,传统数据仓库一般分为四层模型。
DataScience
2020-11-24
2.5K0
day9.数据集成和转换
今天的内容是数据的集成和变换,在做数据分析和挖掘时,百分之八十的时间可能要花在数据预处理部分,准备好相应的数据。数据集成是将多个数据源的数据整合在一起,数据集成建立在对业务的理解之上;数据变换主要是对数据进行规范化处理,转换成适当的形式。
DataScience
2020-06-04
1.1K0
趣搭-嗒集群
将jdk-7u25-linux-i586.tar.gz 分别传到每台机器的/TMP下
DataScience
2020-04-14
1.3K0
Apache Hive Hue
⊙Hue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览HBase数据库等等。
DataScience
2020-01-02
2.1K0
cloudera快速入门
一键部署大数据集群 cloudera quickstart 注:为了节省大家的学习时间 首先这是最低配的大数据集群, 其次融合了各个你需要的组件, 一键导入即可,并且有快速入门教程。 我们先去官网下载
DataScience
2020-01-02
5140
GitHub如何关联域名
一、购买域名,实名认证,不需要备案 本人购买的是阿里云的域名。(ai大数据与机器学习.top) 二、域名解析(本地与服务器映射) 三、接下来会让你输入IP,完成解析 IP地址怎么来呢?打开终端,输入p
DataScience
2020-01-02
1.9K0
Hive中苦笑不得的坑
大家都知道,hive -f 后面指定的是一个文件,然后文件里面直接写sql,就可以运行hive的sql,hive -e 后面是直接用双引号拼接hivesql,然后就可以执行命令。
DataScience
2019-12-30
1.5K0
Apache Hive MSCK
翻译成中文的大概意思就是:Hive将每个表的分区信息保存在metastore中,如果通过hadoop fs -put命令直接将分区信息添加到HDFS,metastore是不会感知到这些新增的分区,除非执行了ALTER TABLE table_name ADD PARTITION命令。但是用户可以运行metastore检查命令MSCK REPAIR TABLE table_name;该命令将关于分区的元信息添加到Hive metastore中,这是对于那些没有元信息的分区来说的。换句话说,就是将任何存在于HDFS上但不在metastore上的分区添加到metastore。
DataScience
2019-12-30
8900
Apache Hive Load Data
数据导入方式: 1) 从本地文件系统中导入数据到hive 表 2)从HDFS上导入数据到hive表 3)从别的表中查询出相应的数据并导入到hive 表 4)在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中。
DataScience
2019-12-30
8110
Apache Hive TM
Apache Hive™数据仓库软件有助于使用SQL读取,编写和管理驻留在分布式存储中的大型数据集。可以将结构投影到已存储的数据中。提供了命令行工具和JDBC驱动程序以将用户连接到Hive。
DataScience
2019-12-30
1K0
cloudera入门总结
第一天 impala & join 第二天 Bulk upload data 第三天 spark 第四天 Flume
DataScience
2019-12-30
3690
HDFS ACL权限管理 初解
Hadoop中的ACL与Linux中的ACL机制基本相同,都是用于为文件系统提供更精细化的权限控制。
DataScience
2019-12-30
8330
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档