首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >sqoop --split-by详解

sqoop --split-by详解

作者头像
shengjk1
发布2018-10-24 15:20:06
发布2018-10-24 15:20:06
2.6K0
举报
文章被收录于专栏:码字搬砖码字搬砖

其实sqoop中相对来说最有意思的就是–split-by了,咱们来唠唠

假设有一张表test,sqoop命令中–split-by ‘id’,-m 10,会发生怎样奇特的事情。首先呢,sqoop会去查表的元数据等等,重点说一下sqoop是如何根据–split-by进行分区的。首先sqoop会向关系型数据库比如mysql发送一个命令:select max(id),min(id) from test。然后会把max、min之间的区间平均分为10分,最后10个并行的map去找数据库,导数据就正式开始啦!66666~

注意点: 1.–split-by对非数字类型的字段支持不好。一般用于主键及数字类型的字段

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017年04月11日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档