首页
学习
活动
专区
圈层
工具
发布

sqoop导入hive

1.1hive-import参数 使用--hive-import就可以将数据导入到hive中,但是下面这个命令执行后会报错,报错信息如下: sqoop import --connect jdbc:mysql...原因是因为sqoop导数据到hive会先将数据导入到HDFS上,然后再将数据load到hive中,最后吧这个目录再删除掉。当这个目录存在的情况下,就会报错。...1.2target-dir参数来指定临时目录 为了解决上面的问题,可以把person目录删除掉,也可以使用target-dir来指定一个临时目录 sqoop import --connect jdbc:...mysql://localhost:3306/test --username root --password 123456 --table person -m 1 --hive-import --target-dir...temp 1.3hive-overwrite参数 如果上面的语句执行多次,那么会产生这个表数据的多次拷贝 1.4fields-terminated-by 当吧mysql中的数据导入到hdfs中,默认使用的分隔符是空格

55910
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Sqoop工具导入数据到Hive小记

    在Hive上面创建了一个Dimension表并用ORC格式储存(关于Hive ORC存储的介绍参考 Hive:ORC File Format存储格式详解 ),然后在执行Sqoop导入便会抛出下面的异常...经过几番测试后发现,Sqoop默认导入的数据格式为TXTFILE,所以当建表时使用TXTFILE存储格式就能正常的导入数据,但这不是我们所想要的,又查看了一下文档,发现其在1.4.5版本后提供了一个hcatalog...命令是可以支持ORC File Format,参考命令如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 sqoop import --connect jdbc:mysql...执行Sqoop命令时一下要记得切换到同时安装有Sqoop Client与Hive Client的集群机器上,不然就会出现数据导入失败的情况。...参考: Sqoop使用手册 Hive:ORC File Format存储格式详解 Hive创建表时添加中文注释后乱码问题 SQOOP Import to Snappy ORC qoop Hive

    26700

    Hive+Sqoop+Mysql整合

    Hive+Sqoop+Mysql整合 在本文中,LZ随意想到了一个场景: 车,道路,监控,摄像头 即当一辆车在道路上面行驶的时候,道路上面的监控点里面的摄像头就会对车进行数据采集。...中创建table并且导入数据 -- 创建table,并且把结果数据导入到Hive table里面 cd /root/vehicle_dir/ vi hive_vehicle.sql --1.drop...配置文件 --配置sqoop:hive数据导入到mysql中 --注意: --export-dir /user/hive/warehouse/t_monitor_camera/ 这里的地址可以在hive...cd /root/vehicle_dir/ vi hive_to_mysql_for_vehicle export --connect jdbc:mysql://node1:3306/sqoop_db...QAZ2wsx3edc use sqoop_db; --如果有则删除 DROP TABLE IF EXISTS t_hive_to_mysql_for_vehicle; CREATE TABLE t_hive_to_mysql_for_vehicle

    2.7K20

    0657-6.2.0-Sqoop导入Parquet文件Hive查询为null问题

    3.使用Sqoop从MySQL导入数据到HDFS,要导入的目录是Hive中新建表的数据目录 sqoop import --connect jdbc:mysql://192.168.0.178:3306/...5.数据导入成功后查看Hive表的数据 Hive中查看,查询出的数据为null ? Impala中查看,可以正常查看数据 ?...3 问题解决 解决方式有两种,如下: 1.Sqoop命令从MySQL中抽取数据到HDFS时,query语句中指定Hive建表时定义的列名。...·修改Sqoop命令如下,在query中指定Hive表定义的列名 sqoop import --connect jdbc:mysql://192.168.0.178:3306/test --username...4 总结 1.使用Sqoop命令进行数据抽取为Parquet格式时,如果导入的数据的列名与Hive建表时定义的列名不一致,会导致Hive中查询到数据为null,因为Hive默认使用列名来访问Parqeut

    1.9K10

    Sqoop之导入到Hive时特殊字符导致数据变乱

    问题是这样的:     Sqoop从关系型数据库导入数据到Hive时,发现数据量增多了,查找之后发现是由于源数据中含义\r\t\n特殊字符的数据,这样Hive遇到之后就将其视为换行,所以导入到Hive...方法1: sqoop的sql中对含有特殊字符的字段进行replace操作,如下List-1所示,将特殊字符转换为空格。...List-1 从mysql导入时用replace replace(replace(replace(description,'\r',' '),'\n',' '),'\t',' ') 方法2: 使用hive-drop-import-delims...,这是sqoop官方提供的一个参数,导入到hive时,遇到特殊字符就会将改字符丢弃,如下List-2 List-2 sqoop import \ --connect jdbc:mysql://xxxxxxx..."\t" \ --lines-terminated-by "\n"     Sqoop还提供了另一个参数--hive-delims-replacement,它会将特殊字符替换为我们设定的字符。

    1.6K30

    sqoop 从sqlserver2008 导入数据到hadoop

    试验对象是我第一个名为ST_Statistics的一张表,我要把我表里的数据导入到hdfs、hive以及hbase当中,然后试验才算完成。   ...1.导入数据到hdfs   sqoop import --connect 'jdbc:sqlserver://192.168.1.105:1433;username=sa;password=cenyuhai...  sqoop支持两种增量导入到hive的模式, 一种是 append,即通过指定一个递增的列,比如:      --incremental append  --check-column id --...--create-hive-table   不知道为什么,执行hive的导入语句时,就不能用--query了,老报上面的那个提到的那个错误,可能是RP不好,就只能改成这种表加上过滤条件的方式了。...5.把数据从hdfs导回到sqlserver,从hive导出也和这个一样,因为都是文本文件,hbase的话,也是不支持直接的,需要通过和hive结合,才能导出。

    1.8K50
    领券