首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【项目实战】ETL 数据导入

【项目实战】ETL 数据导入

作者头像
十里桃花舞丶
发布2020-09-24 17:40:32
6680
发布2020-09-24 17:40:32
举报
文章被收录于专栏:桥路_大数据桥路_大数据

操作说明

数据已经在 MySQL 中生成,接下来就开始进行数据仓库的搭建环节。首先最重要的,也是首要的流程便是 ETL。这个阶段,因为是对结构化数据进行抽取,所以直接使用 Sqoop 工具即可。Sqoop 工具被安装到了 Node03 中,所以在 Node03 中编写脚本调用 Sqoop 进行数据抽取;而脚本化的编写也有助于之后的自动化执行。

操作流程

1. 进入 Sqoop 安装节点,即 Node03,创建 /home/warehouse/shell 目录:

mkdir -p /home/warehouse/shell

2. 编写 Sqoop 数据导入脚本,对不同的表采用了较为不同的方法,脚本材料如下:

cd /home/warehouse/shell
vim sqoop_import.sh
# 添加内容
#!/bin/bash

db_date=$2
echo $db_date
db_name=mall

import_data() {
sqoop import \
--connect jdbc:mysql://node02:3306/$db_name \
--username root \
--password DBa2020* \
--target-dir  /origin_data/$db_name/db/$1/$db_date \
--delete-target-dir \
--num-mappers 1 \
--fields-terminated-by "\t" \
--query   "$2"' and  $CONDITIONS;'
}

# 数据量少,可以进行全量抽取
import_sku_info(){
  import_data  "sku_info"  "select 
id, spu_id, price, sku_n
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-09-22 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 操作说明
  • 操作流程
相关产品与服务
云数据库 MySQL
腾讯云数据库 MySQL(TencentDB for MySQL)为用户提供安全可靠,性能卓越、易于维护的企业级云数据库服务。其具备6大企业级特性,包括企业级定制内核、企业级高可用、企业级高可靠、企业级安全、企业级扩展以及企业级智能运维。通过使用腾讯云数据库 MySQL,可实现分钟级别的数据库部署、弹性扩展以及全自动化的运维管理,不仅经济实惠,而且稳定可靠,易于运维。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档