腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(806)
视频
沙龙
1
回答
Hive
(
1.1.0
) -
在
使用
动态
分区
将
数据
加
载到
RC
表
时
获取
小文件
、
、
我正在
使用
insert into命令
将
数据
从txt
表
加
载到
RC
表
。目标
表
(
RC
)是
分区
表
,因此启用了
动态
分区
。
在
insert into命令的末尾,我
在
每个
分区
中都有多个
小文件
...我尝试为merge设置一些配置单元参数,但结果大致相同…… 唯一对我有效的事情是,当我
在
inse
浏览 16
提问于2020-09-20
得票数 3
1
回答
S3中带有混合日期的单元日期
分区
表
流
数据
、
、
、
、
我有丰富的经验处理
Hive
分区
表
。我
使用
Hive
2.x,我面试了一个大
数据
解决方案架构师的角色,我被问到了以下问题。 问题:,您将如何在按日期
分区
的
Hive
表
中摄取流
数据
?流
数据
首先存储
在
S3桶中,然后加
载到
Hive
中。虽然S3桶名有一个日期标识符(如S3_ingest_YYYYMMDD ),但内容可能有超过一个日期的
数据
。我的
浏览 1
提问于2019-12-21
得票数 1
回答已采纳
4
回答
蜂巢中
动态
和静态
分区
的主要区别
蜂巢中静态
分区
和
动态
分区
的主要区别是什么?
使用
单个insert意味着静态,而对
分区
表
的单个insert表示
动态
。还有其他优势吗?
浏览 2
提问于2015-06-18
得票数 18
回答已采纳
1
回答
如何
将
原始日作为
Hive
中的
分区
插入到
表
中?
、
string) LIFECYCLE 160; select * from aaa我创建了一个名为h5_qti_desc的
表
,我想从另一个aaa
表
中插入该
表
,该
表
具有day字段,并且
在
aaa中没有
分区
。
表
aaa有几天时间,比如“20171010”,“20171015”. 如何
将
day作为
分区
一次插入到h5_qti_desc中,aaa中的天数
在
浏览 1
提问于2017-10-19
得票数 0
回答已采纳
2
回答
哪种文件格式更适合在配置单元中存储更多数量的
小文件
?为什么?
、
如果我有更多的
小文件
需要存储
在
配置单元
表
中。哪种文件格式的存储方式更好?为什么?
浏览 0
提问于2019-06-04
得票数 1
1
回答
是什么导致了蜂窝
表
分区
中的不同模式?
、
、
我看到同一个单元
表
有不同的
分区
模式,如下所示:hdfs dfs -ls /data/
hive
/warehouse/db_name/table_name/part_date/data/
hive
/warehouse/db_name/table_name/part_date=2019-12-01/part-06669 /data
浏览 1
提问于2020-03-20
得票数 0
回答已采纳
1
回答
使用
Sqoop实现
Hive
表
动态
分区
加载
、
我有一个名为dept的MySQL
表
,我基于时间戳列ts将其加
载到
配置单元外部
表
dept
表
中,作为增量附加检查列last-value。这可以很好地工作,现在我想根据dept_name和ts列
将
动态
分区
添加到我的配置单元
表
dept中。 我知道我可以
在
sqoop之外创建
表
动态
分区
,但在
将
数据
加
载到
动态
分区</
浏览 22
提问于2016-08-26
得票数 0
1
回答
从oracle和导入
数据
动态
创建单元
分区
表
的Sqoop
、
、
我
在
oracle中有一个
表
(
表
名为TRCUS),其中包含客户的详细信息,根据年份和月份进行
分区
。Oracle中的
分区
名称: PERIOD_JAN_13、PERIOD_FEB_13、PERIOD_JAN_14、PERIOD_FEB_14等 现在,我想直接
使用
SQOOP
将
这个
表
的
数据
导入到
HIVE
中。Sqoop作业应该创建一个
hive
表
,基于oracle
表
分区
浏览 6
提问于2017-10-16
得票数 1
回答已采纳
5
回答
分区
表
中的配置单元加载
、
我
在
HDFS中有一个日志文件,值由逗号分隔。例如:现在我想把这个文件加
载到
Hive
表
中,它有"timestamp","action“列,如何请求配置单元
将
日志文件中最后两列作为
表
的
分区
?所有示例e.g.');"都需要在脚本中定义
分区
,但我希望从HDFS文件自动设置
分区
。一种解决
浏览 0
提问于2012-10-31
得票数 17
回答已采纳
2
回答
单元格:
在
使用
外部
表
时
,单元格是否支持
分区
和存储?
、
在
创建
Hive
表
时
使用
PARTITIONED BY或CLUSTERED BY关键字
时
,
hive
将
创建对应于每个
分区
或桶的单独文件。但是对于外部
表
来说,这仍然有效。蜂巢“中的几个摘录 当我们
将
数据
加
载到
浏览 7
提问于2017-06-27
得票数 0
1
回答
如何
使用
Hive
中的日期根据周对表进行
动态
划分
有一个“结果”
表
,其中包含Id和日期列。创建
表
结果(Id int,日期字符串)作为文本文件存储;2012-04-0613 2013-02-1016 2014-04-0118 2014-06-032014-08-26 如何根据上述日期列中的年份和周no
动态
分区
,将上述
数据
存储到“历史”
表
中。
在</
浏览 2
提问于2014-11-03
得票数 3
回答已采纳
2
回答
无法
将
数据
加
载到
配置单元中的
分区
表
中
我无法
将
数据
加
载到
分区
表
中,因为它显示“
动态
分区
严格模式需要至少一个静态
分区
列。要关闭此功能,请设置
hive
.exec.dynamic.partition.mode=nonstrict”,即使
在
设置set
hive
.exec.dynamite.partition.mode=nonstrict
时
也是如此;
hive
>集合
hive
.exec.d
浏览 0
提问于2015-03-03
得票数 0
1
回答
蜂巢中的
分区
、
、
、
、
我
使用
hive
中的静态
分区
来根据date字段
将
数据
重新划分到子目录中,我需要为每个
表
(总共14个
表
)每年需要365个
分区
,因为我每天都要将
数据
加
载到
hive
中。是否对可以
在
单元格中创建的静态
分区
的数量有任何限制?
在
sqoop导入中,如果"
hive
.exec.max.dynamic.partitions.pernode“
浏览 0
提问于2015-03-17
得票数 4
1
回答
单元
动态
分区
不工作
、
我试图
在
表
中创建
动态
分区
。set
hive
.exec.dynamic.partition.mode=nonstrict; 4)
将
数据
从stock2中加
载到
stock
浏览 2
提问于2016-05-07
得票数 0
回答已采纳
1
回答
当尝试
将
hdfs中的csv文件加
载到
hive
表
时
没有选择行
、
、
当我通过putty登录到Edge节点
时
,我能够查看文件的路径和内容,这与我
将
文件放入hdfs
时
使用
的帐户凭据相同。然后,我连接到
Hive
,并尝试
使用
以下语句创建一个外部
表
,指定我的csv文件
在
hdfs中的位置: CREATE EXTERNAL TABLE(col1 string, col2 string) ROWFORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS ORC LOCAT
浏览 0
提问于2018-03-30
得票数 0
3
回答
动态
分区
和插入特定列
、
、
有一个包含大约100列的
HIVE
表
,按列ClientNumber和Date进行
分区
。我正在尝试将来自另一个
HIVE
表
的
数据
插入到仅30列中,并
动态
创建Date
分区
。问题是所有
数据
都会加
载到
"ClientNumber=123/date=__
HIVE
_DEFAULT_PARTITION__“
分区
中,这并不是我们所期望的。脚本如下所示: set
hive</e
浏览 2
提问于2016-11-21
得票数 0
3
回答
单元格-
分区
列等于当前日期
、
我正在尝试从今天没有列的另一个
表
中插入一个
Hive
表
。我试图创建的
分区
位于日期级别。当我运行这个程序时,我会得到以下错误:如果我查询一个
表
并使其中一个列正常工作知道如何在HiveQL中将
分区
日期设置为当前的系统日期吗?克雷格
浏览 3
提问于2015-02-26
得票数 5
回答已采纳
2
回答
Hive
0.12中外部
表
的
动态
分区
、
、
在
Hive
文档中,它讨论了外部
表
的
动态
分区
:。我最近升级到了
Hive
0.12,并希望
使用
动态
外部
表
分区
,方法是
在
DDL的location部分中给出
表
的根HDFS位置,然后添加子目录,这些子目录将自动添加到
表
中。子目录将由Flume代理创建,该代理
将
添加日期作为路径名。我希望位于根目录顶部的
Hive
表
能够自动拾
浏览 1
提问于2014-08-14
得票数 0
1
回答
配置单元
动态
分区
-来自Spark的并发写入会损坏
数据
、
、
我们已经设置了一个spark作业来插入到
Hive
中(
使用
数据
帧)。设置
hive
表
用于创建
动态
分区
。只要我们运行一个spark作业
将
数据
插入到
Hive
中,一切都会完美地工作。我们遇到的问题是,我们预计要运行并发的spark作业来
将
数据
加
载到
Hive
中。这似乎不起作用。我读到过
动态
分区
不提供排它锁,而是提供共享锁。
浏览 4
提问于2016-12-28
得票数 3
1
回答
利用NiFi
将
CSV
数据
摄取到蜂巢中
、
、
、
、
我正在尝试
将
csv
数据
摄取到
Hive
数据
库中。为此目的,listFile --> FetchFile --> ConvertCSVToAvro --> ConvertAvroToOrc --> PutHDFS现在,我想用putHiveQL处理器进行测试。 为此,我需要将CSV<em
浏览 1
提问于2019-05-16
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券