腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
API
而
不是
SQL
从
Spark
创建
配置
单元
表
?
、
、
我想
创建
一个带有分区的hive
表
。我可以
使用
Spark
-
SQL
来做这件事,
使用
:
spa
浏览 7
提问于2017-08-13
得票数 1
3
回答
如何
使用
Spark
SQL
Scala
API
(非
SQL
)检查
配置
单元
表
是否为外部
表
我
使用
以下代码(
Spark
SQL
Scala
API
)来检查Hive
表
是否为外部
表
,但Table
API
没有方法来回答给定
表
是否为外部
表
。我会问如何
使用
Spark
SQL
Scala
API
(
而
不是
SQL
)检查
配置
单元
表
是否为外部
表
代码
浏览 22
提问于2019-11-06
得票数 1
回答已采纳
2
回答
在
Spark
中,CREATE table命令是否
创建
外部
表
?
、
、
、
基于GitHub ()中的以下线程,我理解CREATE TABLE + Options (如JDBC),将
创建
一个
配置
单元
外部
表
?这些类型的
表
不会实现自身,因此当通过
SQL
删除该
表
或
从
Databricks tables UI中删除该
表
时,不会丢失数据。
浏览 2
提问于2016-04-29
得票数 2
1
回答
使用
Spark
SQL
列出Hbse
表
、
、
我想
使用
Spark
SQL
列出Hbase
表
。val hiveContext = new HiveContext(sqlContext) val listOfTables = hiveContext.
sql
浏览 2
提问于2017-01-22
得票数 0
1
回答
使用
Spark
时如何在hive中获取TimeStamp数据
、
val
sql
= "select time from table"在hive
表
中,timestamp.whenval data =
sql
(
sql
).map(_.get(0).toString)谁能告诉我如何
使用
Spark
在hive中获取TimeStamp数据?
浏览 0
提问于2016-10-26
得票数 0
1
回答
将dynamodb
表
复制到
配置
单元
的pyspark代码问题:不允许操作
、
、
、
我正在尝试
使用
pyspark代码
从
aws emr上的Dynamodb
创建
一个外部
配置
单元
表
。当我在hive提示符上执行该查询时,它工作得很好,但当我将它作为pyspark作业执行时,它就失败了。代码如下:from pyspark.
sql
import SparkSession
spark
= SparkSession.builder.enableHiveSuppo
浏览 2
提问于2019-05-10
得票数 2
1
回答
配置
Spark
和独立
配置
单元
MetaStore以将DafaFrames持久化到s3
、
、
、
、
我正在尝试
使用
HiveContext在SparkSQL中持久化一个DataFrame,当我将我的作业提交到独立的本地
spark
服务器时,我看到了以下错误:这是我的
spark
-submit: ./bin/
sp
浏览 0
提问于2015-11-19
得票数 2
3
回答
无法
从
配置
单元
查询`saveAsTable`之后的
Spark
DF -
Spark
SQL
特定格式,与
配置
单元
不兼容
、
、
、
、
我正在尝试将数据帧保存为外部
表
,该
表
将同时
使用
spark
和可能的hive进行查询,但不知何故,我无法
使用
hive查询或查看任何数据。它在
spark
中工作。以下是如何重现该问题的方法:hivesc
浏览 3
提问于2019-08-02
得票数 0
2
回答
通过sparkSQL
创建
蜂窝
、
、
、
我已经
创建
了一个临时
表
,该
表
在列关键字上存储桶。但是,当我通过另一个
表
手动将数据插入到这个
表
中时,我看到了以00000_*为前缀的文件。我不确定
spark
sql
是否将数据写入存储桶
浏览 1
提问于2018-08-02
得票数 5
3
回答
createOrReplaceTempView在
Spark
中是如何工作的?
、
、
我是
Spark
和
Spark
SQL
的新手。如果我们将对象的RDD注册为
表
,
spark
会将所有数据保存在内存中吗?
浏览 87
提问于2017-05-17
得票数 74
回答已采纳
2
回答
使用
Spark
SQL
创建
带有连接的
配置
单元
表
时
使用
的引擎
、
、
、
我不能从文档中确定当
使用
Spark
中的HiveContext
创建
Hive
表
时,它是
使用
Spark
引擎还是标准Hive mapreduce作业来执行任务?val sc = new SparkContext() CREATE TABLE db.new_table
浏览 0
提问于2018-07-13
得票数 0
3
回答
如何在不删除没有新数据的分区的情况下在
Spark
中分区和写入DataFrame?
、
、
、
我正在尝试
使用
DataFrameWriter以Parquet格式将DataFrame保存到HDFS,该文件由三个列值划分,如下所示:singlePartition.write.mode(SaveMode.Overwrite).parquet(path + "/eventdate=2017-01-01/hour=0/processtime=1234567890")
浏览 2
提问于2017-02-19
得票数 37
1
回答
如何
从
Apache
Spark
on Analytics Engine读取和写入
配置
单元
表
、
、
我想在Watson Studio中的Jupyter笔记本上
使用
Spark
on analytics engine,以便能够读取和写入Hive
表
,但我不清楚如何通过读取
Spark
来做到这一点。不清楚的原因是IBM Analytics Engine预
配置
了
Spark
,并且不提供root访问权限。我在网上找到了一些generic hadoop的帖子,描述了如何
使用
元存储位置
创建
hive.xml,但不清楚如何将其转换到IBM Analytics Engine
浏览 27
提问于2018-06-02
得票数 0
回答已采纳
3
回答
如何
从
spark
连接到远程
配置
单元
服务器
、
、
、
我在本地运行
spark
,希望访问位于远程Hadoop集群中的Hive
表
。[ml@master
spark
-2.0.0]$./bin/beeline beeline> !SLF4J: Found binding in [jar:file:/home/ml/
spark
浏览 4
提问于2016-10-12
得票数 15
回答已采纳
2
回答
Spark
SQL
扮演什么角色?内存DB?
、
最近我开始
使用
Spark
SQL
。我读了数据源
Api
,仍然不明白
Spark
SQL
的作用是什么。真的愿意接受任何答案。 诚挚的问候。
浏览 0
提问于2018-01-16
得票数 1
1
回答
pyspark 1.3.0将数据帧保存到
配置
单元
表
中
、
、
我正在
使用
spark
1.3.0 (在python)DF.show(3) 我正在尝试将该DF保存到不存在
配置
单元
表
中"write" among (IMSI, Date, Hour, Tim
浏览 0
提问于2017-01-20
得票数 0
1
回答
Spark
上的
配置
单元
不返回聚合或连接查询的结果
、
、
Aggregation或Join不会
从
外部
表
的
配置
单元
查询中返回任何结果。 我已经将
配置
单元
设置为
使用
Spark
(独立)作为查询引擎,
而
不是
使用
MR.。我已经
创建
了一个外部
表
(
从
elastichsearch索引)。有了SELECT,一切都好,数据返回: SELECT * FROM table1 LIMIT 100 尝试
使用
简单
浏览 15
提问于2019-06-10
得票数 1
1
回答
在
spark
2.0中访问指定数据库限定符的
配置
单元
表
、
、
我正在尝试
使用
spark
sql
访问指定数据库限定符的
配置
单元
表
。我正在
使用
sparksession,因为它是
spark
2.0或更高版本。例如,我正在尝试向现有
表
中添加一个分区。查询为它不会抛出任何错误,但甚至不会
创建
任何分区。是<em
浏览 1
提问于2018-02-28
得票数 0
3
回答
spark
.
sql
.autoBroadcastJoinThreshold是否
使用
Dataset的join运算符来连接?
、
我想知道
spark
.
sql
.autoBroadcastJoinThreshold属性对于在所有工作节点上广播较小的
表
(同时进行连接)是否有用,即使在连接方案
使用
Dataset
API
连接
而
不是
使用
Spark
如果我的更大的
表
是250吉,更小的是20 G,那么是否需要设置这个
配置
:
spark
.
sql
.autoBroadcastJoinThreshold = 21 Gi
浏览 6
提问于2017-05-15
得票数 24
回答已采纳
2
回答
我收到"Failed with exception java.io.IOException:/user/hive/warehouse/people/part-r-00001.parquet not a SequenceFile“
、
、
、
、
我通过在我的数据帧上调用.saveAsTable
创建
了一个
Spark
SQL
表
。该命令完全成功。但是,现在当我查询
表
时,拼图文件似乎已损坏。java.io.IOException: hdfs://ip:8020/user/hive/warehouse/people/part-r-00001.parquet not a SequenceFile"scala >
浏览 3
提问于2016-01-20
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark SQL,DataFrames 以及 Datasets 编程指南
HBaseSQL及分析-Phoenix&Spark
教程:Apache Spark SQL入门及实践指南!
Spark之SparkSQL
Spark Streaming如何读Kafka数据 Hbase如何设计表
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券