腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9001)
视频
沙龙
1
回答
使用
Sqoop
并行
导入
Oracle
表
的
最佳
方式
是什么
?
、
、
、
、
我正在
使用
Sqoop
将
oracle
表
导入
到HDFS中。 我有大约50个
表
要
导入
,50个
表
中有10-15个
表
太大(大约50 15)。这是我第一次想要将它们作为一个完整
的
负载
导入
,之后我将只
导入
增量数据。我把这两个脚本安排在一个特定
的
时间,比如早上7点 这两个脚本都运行得很好,但如您所见,它只能
并行
执行两个
sqoop
作业。 但我想一
浏览 19
提问于2019-04-29
得票数 0
7
回答
sqoop
导入
多个
表
、
、
、
我们
使用
的
是Cloudera CDH 4,并且我们能够按照预期将
表
从
Oracle
数据库
导入
到HDFS仓库中。问题是我们
的
数据库中有上千个
表
,而
sqoop
一次只支持
导入
一个
表
。将多个
表
导入
HDFS或Hive有哪些选项?例如,一次将200个
表
从
oracle
导入
HDFS或Hive
的
最佳
方式<
浏览 1
提问于2013-06-19
得票数 8
回答已采纳
1
回答
从
oracle
导入
sqoop
的
行为
我想
使用
Sqoop
将大
表
从
oracle
数据库
导入
到HDFS。由于
表
很大,而且有主键,所以
sqoop
可以
并行
运行多个映射器。我有一些问题要问 1)由于
oracle
数据库中
的
错误记录,一个映射器出现异常,其他映射器运行正常。那么所有的作业都将失败,或者除了一个映射器数据之外,所有其他映射器都将在HDFS中写入数据?2)如果我们
使用
hive --m选项,
sqoop
是否足够智能来运行<em
浏览 0
提问于2018-02-28
得票数 0
1
回答
在parallal中为不同模式查询同一
表
失败
我们在
Oracle
中有不同
的
数据库模式。我们计划从
oracle
到Hive ware house中
的
一些
表
进行
sqoop
。但是如果我们把一个oltp
的
表
的
sqooping是顺序
的
,那么它是有效
的
。但为了更好地
使用
,我们计划
并行
地
sqoop
不同
的
oltps
表
,但它正在
并行
sqoop</em
浏览 2
提问于2013-10-22
得票数 0
1
回答
从
Oracle
提取数据到Hadoop。
Sqoop
是个好主意吗
、
、
、
我希望从
Oracle
数据库中提取一些数据,并将其传输到远程HDFS文件系统。实现这一目标似乎有几种可能
的
方法: 我
的
问题是,第一种方法(对我来说工作较少)会导致
Oracle
锁定
表
的
时间超过所需时间吗?我担心
的
是,当<em
浏览 7
提问于2016-02-16
得票数 2
1
回答
Hadoop MapReduce DBInputFormat和DBOutputFormat
、
、
我需要从MYSQL
导入
数据,运行MR并将其导出回MYSQL。我能够用DBInputFormat和DBOutputFormat成功地在一张先生
的
工作中成功地完成几张记录。替代方法是将数据导出到HDFS,运行MR job并将其推回我
的
SQL。对于包含大约百万条400+记录
的
庞大数据集,
使用
DBInputFormat和DBOutputFormat或
使用
HDFS作为数据源和目标,哪个选项更好。
使用
HDFS会在我
的
MR工作之前和之后增加一个步骤。由于数据存储在H
浏览 0
提问于2013-07-26
得票数 0
回答已采纳
5
回答
split-by <column> --target-dir在
Sqoop
中
的
作用
是什么
当我们在
sqoop
中编写--split-by时,内部会发生什么?示例:
sqoop
import --connect jdbc:mysql://localhost/test --username root --password training123 --query
浏览 3
提问于2016-06-25
得票数 2
1
回答
如何
使用
Sqoop
将特定用户
的
所有(且仅限)
表
从
Oracle
DB
导入
配置单元
、
、
我有一个数据库有很多表(超过600),并希望将它们全部
导入
到配置单元
使用
sqoop
。这就是我
使用
的
命令:
导入
总是失败,因为
sqoop
尝试
导入
一些不属于该用户<
浏览 1
提问于2013-01-17
得票数 1
回答已采纳
1
回答
如何
使用
sqoop
将数据从数据库
导入
到多个hdfs文件中?
我
使用
sqoop
将数据以avro格式从
oracle
导入
hdfs。我想通过写入多个hdfs文件(每个映射器实例一个)来
并行
这个过程,因为记录顺序对我来说并不重要。在
sqoop
中有这样做
的
选项吗?
浏览 1
提问于2015-05-15
得票数 0
3
回答
为什么这个用于列出
Oracle
数据库中
的
表
的
Sqoop
命令不起作用?
、
我尝试
使用
以下
Sqoop
命令列出
Oracle
数据库中
的
表
:
sqoop
list-tables --connect jdbc:
oracle
:thin:@//10.13.25.118:1521/udc.ds.dtvops.net
浏览 0
提问于2013-11-13
得票数 2
1
回答
从
oracle
导入
时出现
Sqoop
日期问题
、
、
、
、
我正在尝试将一个巨大
的
表
从
oracle
10g
导入
到HDFS (GCS,因为我在Google Cloud Dataproc中
使用
sqoop
)作为AVRO。当
表
没有任何日期列时,一切都很正常,但是当它有日期列时,
导入
的
日期是非常错误
的
。例如:
Oracle
data -> 30/07/76和HDFS data -> 14976-07-30 20:02:00.0 例如:
浏览 2
提问于2020-12-04
得票数 0
2
回答
如何在运行
Sqoop
导入
和导出时找到映射器
的
最佳
数量?
、
、
、
、
我
使用
的
是
Sqoop
版本1.4.2和
Oracle
数据库。./
sqoop
import \ --jtcool column> \ --verbose --m
浏览 0
提问于2013-05-17
得票数 6
1
回答
从
oracle
和
导入
数据动态创建单元分区
表
的
Sqoop
、
、
我在
oracle
中有一个
表
(
表
名为TRCUS),其中包含客户
的
详细信息,根据年份和月份进行分区。
Oracle
中
的
分区名称: PERIOD_JAN_13、PERIOD_FEB_13、PERIOD_JAN_14、PERIOD_FEB_14等 现在,我想直接
使用
SQOOP
将这个
表
的
数据
导入
到HIVE中。
Sqoop
作业应该创建一个hive
表
,基于
oracle</e
浏览 6
提问于2017-10-16
得票数 1
回答已采纳
1
回答
如何为
sqoop
导入
作业传递java属性
在
使用
sqoop
时,
导入
可以传递java属性。在我
的
情况下,我需要通过与--direct一起
使用
sqoop
直接连接到
oracle
。现在,我需要用相同
的
参数创建一个
sqoop
作业,但是当我尝试发出
sqoop
job --create myjob -- import -Doraoop.
oracle
浏览 4
提问于2016-09-08
得票数 1
1
回答
Sqoop
-基于
oracle
分区
表
模式创建空单元分区
表
、
、
、
我有一个
oracle
表
,它有80列,id在state列上分区。我
的
要求是创建一个具有类似
oracle
表
模式并在状态上进行分区
的
hive
表
。错误
sqoop
.
Sqoop
:获得运行
Sqoop
: java.lang.IllegalArgumentException:分区键状态
的
异常不能是要<e
浏览 3
提问于2014-10-09
得票数 0
回答已采纳
1
回答
Hadoop中
的
日期处理
、
、
、
我是大数据/Hadoop生态系统
的
新手,我注意到日期并不总是以标准
的
方式
跨技术处理。我计划
使用
带有Avro和Parquet文件格式
的
Sqoop
将来自
Oracle
的
数据摄取到HDFS上
的
Hive
表
中。Hive继续将我
的
日期
导入
到BIGINT值中,我更喜欢时间戳。我试过用“--地图列-蜂巢”覆盖.但还是不起作用。 寻找关于处理此用例日期
的
最佳</em
浏览 2
提问于2017-04-23
得票数 0
回答已采纳
2
回答
使用
sqoop
在配置单元
表
中进行索引更新
、
、
我在
oracle
中有一个只有4列
的
表
...uuid -字符串更新日期-日期 我想
使用
sqoop
将这些数据
导入
HIVE
表
中。HIVE
表
中
的
数据。现在,我想用updatedate (今天
的
最后一个值)
的
增量更新来更新这个
表
,这样我就可以
使用
sqoop
将该OLTP
表
的</
浏览 1
提问于2016-07-05
得票数 1
2
回答
是否可以
使用
sqoop
导入
表
并添加额外
的
时间戳列?
、
、
、
是否可以
使用
sqoop
命令"import table“将
表
从
oracle
数据库
导入
到Hadoop集群中,并
使用
当前时间戳添加额外
的
列(用于故障排除目的)?到目前为止,我有以下命令:
sqoop
import -Dorg.apache.
sqoop
.splitter.allow_text_splitter=true --connect jdbc:
oracle
:thin:@//MY_
O
浏览 22
提问于2018-01-01
得票数 0
1
回答
SQOOP
从
ORACLE
数据库
导入
特定模式中
的
所有
表
、
、
、
我正在尝试
使用
Sqoop
命令从
Oracle
数据库
导入
特定模式中
的
所有
表
:
sqoop
import-all-tables --connect jdbc:
oracle
:thin:server:port:database --username x --password y --warehouse-dir warehouse-dir --hive-import --create-hive-table 但是这个
Oracle
数据库有更多
浏览 13
提问于2020-08-11
得票数 0
1
回答
如何将火花流输出推送到
oracle
、
、
我有一个火花流程序,它将在一个15分钟
的
窗口中聚合和处理数据。它
的
输出需要推送到
oracle
表
中。 这里最好
的
方法
是什么
?如果我将我
的
数据写进蜂巢,然后
使用
sqoop
将其推送到
oracle
,那么我将不得不将
sqoop
的
工作安排在一定
的
频率上,
sqoop
应该以某种
方式
了解它以前提取
的
数据以及它现在应该从蜂巢中提
浏览 0
提问于2018-02-09
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
详解大数据采集引擎之Sqoop&采集oracle数据库中的数据
Sqoop是什么,与Flume有何不同?
大数据系列 sqoop1的核心命令
Sqoop使用流程
【云原生】Sqoop on k8s 讲解与实战操作
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券