前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Sqoop入门介绍及安装

Sqoop入门介绍及安装

作者头像
大数据梦想家
发布2021-01-26 10:54:35
3210
发布2021-01-26 10:54:35
举报
文章被收录于专栏:大数据成长之路

介绍

Apache Sqoop是在Hadoop生态体系和RDBMS体系之间传送数据的一种工具。来自于Apache软件基金会提供。

Sqoop工作机制是将导入或导出命令翻译成mapreduce程序来实现。在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。

Hadoop生态系统包括:HDFS、Hive、Hbase等

RDBMS体系包括:Mysql、Oracle、DB2等

Sqoop可以理解为:“SQL 到 Hadoop 和 Hadoop 到SQL”。

在这里插入图片描述
在这里插入图片描述

站在Apache立场看待数据流转问题,可以分为数据的导入导出:

代码语言:javascript
复制
    Import:数据导入。RDBMS----->Hadoop
    Export:数据导出。Hadoop---->RDBMS

安装

这里需要注意的是:

安装sqoop的前提是已经具备java和hadoop的环境。

还没配置好java或者hadoop集群环境的小伙伴们可以浏览小菌前面的文章哦~

目前最新稳定版为1.4.6

关于需要用的jar包,一共有两个

在这里插入图片描述
在这里插入图片描述

大家可以自行去官网下载或者在私信小菌都可以的哦~~

当我们jar包准备好了之后,直接解压后放到我们centos的/export/servers目录下(目录位置可自定义)

        在这里插入图片描述
在这里插入图片描述

然后vim /etc/profile.d/sqoop.sh中设置我们sqoop的环境变量。

代码语言:javascript
复制
export SQOOP_HOME=/export/servers/sqoop-1.4.6.bin__hadoop-2.0.4-alpha
export PATH=$PATH:$SQOOP_HOME/bin

接着进入到sqoop的conf目录下 cd $SQOOP_HOME/conf 改文件名 mv sqoop-env-template.sh sqoop-env.sh 编辑内容 vi sqoop-env.sh

代码语言:javascript
复制
export HADOOP_COMMON_HOME= /export/servers/hadoop-2.7.5 
export HADOOP_MAPRED_HOME= /export/servers/hadoop-2.7.5
export HIVE_HOME= /export/servers/hive

接下来还有至关重要的一步,就是 加入mysql的jdbc驱动包

代码语言:javascript
复制
cp /hive/lib/mysql-connector-java-5.1.32.jar $SQOOP_HOME/lib/

然后我们就可以验证启动啦

代码语言:javascript
复制
bin/sqoop list-databases \
 --connect jdbc:mysql://localhost:3306/ \
 --username root --password hadoop

这里我们连接的是本地的mysql数据库 到这里,整个Sqoop安装工作完成。

受益的小伙伴或对大数据技术感兴趣的朋友记得关注小菌哟٩(๑❛ᴗ❛๑)۶

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/12/15 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 介绍
  • 安装
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档