腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
3
回答
如何在spark中
读取
orc事务单元表?
apache-spark
、
hive
、
apache-spark-sql
、
orc
如何在spark中
读取
orc事务单元表?
hive
> create table default.Hello(id int,name string) clustered by('transactional'='true');<
浏览 0
提问于2018-05-09
得票数 4
6
回答
RDBMS和
Hive
有什么区别?
sql
、
hadoop
、
data-warehouse
、
hive
在
像MySQL这样的远程数据库管理系统中,
Hive
上也有数据库吗?我在手册上看到,
hive
只有表,我对此有点困惑。Tks之前
浏览 0
提问于2011-08-03
得票数 8
2
回答
Presto对approx_distinct的支持
presto
、
approximate
、
hyperloglog
它是否支持
在
摄取时使用HyperLogLog计算进行汇总(类似于Druid)?考虑到与Druid不同,Presto从外部存储(
Hive
/Cassandra/RDBMS等)查询数据,我不确定是否支持摄取时间汇总,除非Presto的本地存储支持它们。有人能确认一下吗?
浏览 8
提问于2017-08-14
得票数 0
1
回答
如何使用最新的AVRO
架构
文件更新配置单元表元数据
hive
、
hdfs
、
bigdata
、
avro
、
hive-metastore
失败: RuntimeException MetaException(message:org.apache.hadoop.
hive
.serde2.SerDeException
在
确定
架构
时遇到AvroSerdeException返回信号
架构
以指示问题:无法从给定路径
读取
架构
: /master_data/XYZ/DA12195/business_date=20181126/_schema.avsc)
架构
文件存在于具有bus
浏览 1
提问于2018-11-30
得票数 0
1
回答
Pyspark +
Hive
avro表
apache-spark
、
pyspark
、
pyspark-sql
、
spark-avro
我创建了
Hive
avro表,并试图从pyspark中
读取
它。主要是尝试
在
pyspark上对这个
Hive
avro表运行基本查询,以便进行一些分析。from pyspark import SparkContexttest.registerTe
浏览 2
提问于2016-12-07
得票数 1
3
回答
Parquet:将特定列读入内存
mapreduce
、
avro
、
parquet
现在,我想从该文件中
读取
特定的列。我如何才能完整地阅读特定的列?我正在寻找java代码的例子。 有没有api可以让我传递需要的列,然后得到一个二维表的数组?
浏览 2
提问于2014-08-16
得票数 3
1
回答
AVRO文件上的
Hive
外部表只为所有列生成空数据
hadoop
、
hive
、
avro
、
spark-avro
、
hive-table
我试图
在
一些使用
Hive
external table生成的avro文件的基础上创建一个spark-scala。我使用的是CDH 5.16,它有
hive
1.1,spark 1.6。但是我在这个位置找不到这些avro文件的
架构
文件。
浏览 1
提问于2019-07-17
得票数 2
回答已采纳
4
回答
配置单元外键?
hive
我是蜂巢的新手。我尝试过搜索不同的网站,但是没有一个能够给我一个清晰的描述: A>外键:一般的蜂窝概念从来没有提到任何关于外键的东西。那么,我们如何实施引用约束呢?(我知道JOIN的语法,所以这是否意味着两个表有一个主键:外键关系?)不支持外键还有更高的目的吗?B>浮点相等比较:这似乎有问题。例如,检查A=3.5 => "A>3.49 A=3.5 A<3.51“。这条路对吗?感谢大家的帮助,
浏览 0
提问于2012-03-14
得票数 5
1
回答
create table中的列规范时间段不识别
hive
我在
读取
avro文件时遇到问题,我
在
架构
文件中有时间戳列名称(tweet string,)STORED AS AVRO LOCATION 'hdfs:////user/<e
浏览 0
提问于2019-01-08
得票数 0
2
回答
如何使用spark/scala +代码+配置通过远程单元存储( s3 orc)加载闪烁s3中的文件
scala
、
apache-spark
、
amazon-s3
、
hive
、
thrift
intellij(星火)-->
Hive
(远程)--存储
在
S3(orc格式)上,无法通过spark/scala
读取
远程
Hive
表。import org.apache.spark.sql.
hive
.HiveContext import org.apache.spark.sql.
hive
.orcval spark = SparkSessio
浏览 0
提问于2018-04-13
得票数 2
1
回答
空火花数据集
读取
蜂巢表
apache-spark
、
hadoop
、
hive
然后我试着用Spark
读取
表的数据: .builder().config("
hive
.execution.engine
读取
test.table1会导致不同的结果-- sqlDF根本不包含任何数据(0行)。星火日志没有显示错误-就像表真的是空的一样。我听说Spark在
读取
事务性或分区的
Hive
表时遇到了一些问题--但事实并非如此。深入研究一下,我发现
Hive
以不同的方
浏览 1
提问于2021-11-24
得票数 2
回答已采纳
4
回答
在
单个实例中将pig输出存储到
Hive
表中
hadoop
、
hive
、
apache-pig
我不想采用通常的方法,即先存储到一个文件中,然后从配置单元中
读取
该文件,然后再插入到表中。我需要减少已经完成的额外跳数。谢谢
浏览 2
提问于2015-07-08
得票数 5
1
回答
关于Apache蜂巢的信息
hadoop
、
hive
、
hdfs
、
hiveql
在
我以前的角色中,我曾短暂地使用过它,但我从来没有完全清楚过它。我的问题是:谢谢!
浏览 3
提问于2021-08-03
得票数 0
回答已采纳
2
回答
Spark忽略TBLPROPERTIES中指定的parquet.compression属性
apache-spark-sql
、
hiveql
、
parquet
我需要从Spark创建一个
Hive
表,该表将采用拼花格式和快速压缩。注意:I试图直接从
Hive
运行相同的查询,如果属性等于SNAPPY表,则可以通过适当的压缩(即SNAPPY而不是GZIP)成功地创建SNAPPY表。
浏览 3
提问于2016-04-29
得票数 4
回答已采纳
1
回答
avro文件中的配置单元外部表
hadoop
、
hive
、
hiveql
、
avro
、
hortonworks-data-platform
有没有可能在不指定模式的情况下从avro文件中
在
Hive
1.2上创建外部表,并让
Hive
从数据中提取它?谢谢
浏览 11
提问于2019-08-05
得票数 1
1
回答
如何使用
Hive
1.2从s3中的拼花文件中创建外部表?
hadoop
、
hive
、
hiveql
、
qubole
我已经
在
Qubole(
Hive
)中创建了一个外部表,它从s3
读取
parquet(压缩: snappy)文件,但是
在
执行SELECT * table_name时,我将获得除分区列之外的所有列的空值。我尝试
在
SERDEPROPERTIES中使用不同的serialization.format值,但我仍然面临相同的问题。
在
删除属性'serialization.format' = '1'时,我将得到ERROR: Failed with exception j
浏览 0
提问于2019-05-15
得票数 2
1
回答
是否可以从CSV列的特定子集创建配置单元表?
csv
、
hadoop
、
select
、
hive
我想在这些CSV文件上创建一个
Hive
表,但只包括列的某个子集(见下文)。我知道我可以创建一个包含所有这些元素的表,然后使用SELECT语句只获取我想要的那些元素,并创建第二个
hive
表,但我想知道是否有方法可以避免这样做。real', 'I2_imag',我不想让
浏览 0
提问于2017-10-03
得票数 1
3
回答
配置单元更改外部表和更新
架构
hadoop
、
hive
COMMENT '' PARTITIONED BY ( ROW FORMAT SERDE STORED AS INPUTFORMAT OUTPUTFORMAT 'org.a
浏览 3
提问于2017-04-14
得票数 0
回答已采纳
1
回答
包含选定列的HDFS群集内拷贝
hadoop
、
hive
、
hdfs
、
avro
、
distcp
我正在使用Avro文件
在
HDFS中存储数据。我需要从一个avro文件中复制选定的列数据,并将其发送到具有其自己的
架构
文件(包含选定列信息)的同一群集中的另一个位置。我该怎么做呢?可以使用
Hive
实现吗?或者,HDFS中有没有什么实用程序可以帮助我做到这一点? 这是必需的,因为一个组必须能够访问整个表,而另一个组应该只能访问几列。
浏览 10
提问于2017-08-10
得票数 0
回答已采纳
1
回答
UNION
在
Hive
中不生成任何数据
sql
、
hadoop
、
hive
、
hiveql
、
hive-query
我不知道
在
执行过程中发生了什么。有人能分享你对这件事的看法吗?我的示例
Hive
如下所示。谢谢。SET
hive
.execution.engine=tez; SET
hive
.qubole.cleanup.partial.data.on.failure=2; SET
hive
.qub
浏览 3
提问于2019-03-05
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券