腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Spark
--
从
Spark
2.3
返回
来自
SQL
Server
的
标识
值
、
、
我需要从在Azure Databricks上运行
的
Spark
向
SQL
表中插入一行,并想知道是否有办法将从
SQL
Server
(@@ identity )生成
的
主键
的
标识
值
返回
到Databricks
浏览 9
提问于2018-08-24
得票数 2
1
回答
在不更改列名
的
情况下创建PySpark数据框
、
、
、
FROM TBL1 在那之后,我正在使用下面的PySpark代码读取新创建
的
位置(TBL2)下面的文件。但是,下面的data frame仅使用lowercase中
的
所有列名创建。而预期
的
结果是在camel case中,就像我在上面对CTAS所做
的
那样。df =
spark
.read.format('ORC') \ .option('header',True) \
浏览 12
提问于2019-12-23
得票数 1
回答已采纳
1
回答
星火
SQL
`
SQL
‘函数转换为字符串?
、
我正在查看星火函数,elt吸引了我
的
眼球。elt returns the n-th input。但是,出于某种原因,elt将我
的
内容转换为字符串:+--------对于这样一个基本函数来说,转换为字符串似乎是一个非常任意
的
限制。
浏览 3
提问于2021-08-19
得票数 0
回答已采纳
3
回答
在
Spark
SQL
中动态绑定变量/参数?
、
、
、
如何在Apache
Spark
SQL
中绑定变量?例如:sqlContext.
sql
("SELECT * FROM src
浏览 21
提问于2014-11-05
得票数 15
2
回答
从
Azure Synapse分析星火池连接Azure
SQL
数据库
、
、
、
有没有人幸运地
从
Azure Synapse Analytics提供
的
火花池连接到Azure
SQL
数据库?我已经将
Spark
上传为一个工作区库,并链接到
Spark
。安装这会导致在尝试启动
Spark
会话时出错。我犯了个错误。Cleaning up the
Spark
service job because the cluster has failed.conn = TokenLibrary.getC
浏览 9
提问于2021-03-12
得票数 0
回答已采纳
2
回答
如何在
Spark
中
从
cassandra datastax云中读取数据
、
、
、
、
如何在
spark
2.0中
从
Cassandra Datastax中读取数据?这就是我试过
的
- val df =
spark
.read.format("org.apache.
spark
.
sql
.cassandra").options(Map("keyspace" -> "my_keyspace" java.lang.ClassNotFoundException: Failed to find data source: org
浏览 5
提问于2020-09-03
得票数 0
2
回答
无法使用pyspark
从
kafka读取数据
、
、
、
我在我
的
kafka主题中有一个流数据。我需要使用pyspark以pyspark dataframe
的
形式
从
topic中读取这些数据。但是当我调用readStream函数时,我不断地收到错误。我
的
代码如下: os.environ['PYSPARK_SUBMIT_ARGS'] = '--packages org.apache.
spark
:
spark
-streaming-kafka-0-8_2.11Please find packages at http:
浏览 15
提问于2018-01-12
得票数 2
2
回答
如何设置
spark
build.sbt文件?
、
、
、
因此,我有一个common库,它将成为
spark
的
核心库。org.apache.
spark
" % "
spark
-
sql
_2.10" % "1.6.0" exclude("org.apache.hadoop", "hadoop-yarn-
server
-web-proxy"), // "org.apache.
spark
" % &qu
浏览 1
提问于2018-03-25
得票数 3
回答已采纳
1
回答
使用Maven UDF在Azure上运行数据库
的
GeoSpark?
、
、
、
我安装了: GeoSpark :1.3.1geospark-
SQL
_
2.3
:1.3.1受https://databricks.com/notebooks/geospark-notebook.html
的
启发我喜欢
SQL
并且想运行GeoSpark查询。我运行以下代码(
从
Notebook): %scala import com.vividsolutions.jts.geom.附言:我还试过: CREATE FUNCTION ST_Point AS 'org
浏览 19
提问于2020-10-02
得票数 1
2
回答
Spark
(
2.3
+)可从PySpark/Python调用
的
Java函数
、
、
re
Spark
文档
2.3
: 将Java用户定义函数注册为
SQL
函数。该
值
可以是pyspark.
sql
.types.DataType对象,也可以是DDL格式
的
类型字符串。我
的
问题是: 我想有一个大量
的
UDF库,为火花
2.3
+,都是用Java写
的
,都可以
从
PySpark/P
浏览 76
提问于2018-08-11
得票数 0
3
回答
shuffle散列连接和排序合并连接到底是如何工作
的
?
我可以解释广播连接是如何工作
的
,本文很好地解释了这一点:https://jaceklaskowski.gitbooks.io/mastering-
spark
-
sql
/
spark
-
sql
-joins-broadcast.html但是我找不到一篇文章来解释shuffle、hash、join和sort merge join
的
内部原理。有没有人能给出这两个
的
逐步算法?
浏览 26
提问于2019-02-21
得票数 3
1
回答
如何在
Spark
2.3
中使用map_from_arrays()
我在
Spark
2.3
中有以下
来自
JSON文件
的
Dataframe: root | |-- element: structmap (containsNull = true) | | |-- value: string (nullable = true) 我在
Spark
2.4我如何在
Spark
2.3
中实现这一点?请提供
浏览 96
提问于2021-05-09
得票数 0
1
回答
星星之火: NoClassDefFoundError: org/apache/tez/dag/api/SessionNotRunning会话初始化中
的
错误
、
、
、
、
我面临
的
问题,同时启动火花-
sql
会话。WARN HiveConf: HiveConf of name hive.tez.cartesian-product.enabled does
浏览 1
提问于2018-10-11
得票数 2
回答已采纳
2
回答
无法使用允许模式保留已损坏
的
行
、
、
、
下面是我
的
密码。(StructType.scala:305) at org.apache.
spark
.
sql
.execution.datasources.FileFormatWriter$.,它说为了保留损坏
的
数据列,我们需要在模式中定义它,我正在这样做。解决这一问题
的
任何帮助都是非常感谢
的
。
浏览 4
提问于2021-03-02
得票数 2
回答已采纳
1
回答
Apache
Spark
2.3.0 -如何将两个array<string>合并成一个array<string>
、
、
将两个array<string>合并成一个array<string>在2.4.x版本中是可能
的
,也很容易,但在2.3.0版本中找不到这样做
的
方法。输入-预期输出-有人能解释一下如何使用Java在
Spark
浏览 9
提问于2021-09-22
得票数 1
2
回答
我可以在CDH中安装多个火花版本吗?
、
我使用
的
是cdh5.1.0,它已经安装了默认火花。然而,我想使用星火1.3。我也可以将这个版本安装到cdh5.1.0中吗?怎么可能设置这些呢?新版本
的
火花是否也会通过Cloudera经理进行监控?
浏览 1
提问于2015-04-17
得票数 3
回答已采纳
6
回答
火花失效:引起: org.apache.
spark
.shuffle.FetchFailedException:太大
的
框架: 5454002341
、
、
我正在为确定父子表
的
表生成层次结构。下面是使用
的
配置,即使在收到与太大
的
帧有关
的
错误之后:--conf
spark
.yarn.executor.memoryOverhead=1024mb \import org.apache.
spark
.SparkContext; import org.apache.
spark
.
sql
.{
浏览 3
提问于2018-07-11
得票数 8
1
回答
连接
来自
同一
spark
流数据集
的
两个流
、
、
在
Spark
structutred streaming (
2.3
)中,是否允许连接
来自
同一输入流数据集
的
两个流?
spark
.
sql
("SELECT temperature, time, device, category FROM Input").cre
浏览 1
提问于2018-07-29
得票数 1
3
回答
通过
Spark
SQL
将tableau与Elastic search连接起来
、
、
、
我找到了一个讨论如何通过Hive
SQL
将Tableau连接到Elastic Search
的
。我想知道有没有办法通过
Spark
SQL
连接到Elastic Search,因为我对hive不是很熟悉。
浏览 2
提问于2015-02-24
得票数 0
2
回答
Kafka_2.12-2.3.0和
Spark
_2.4.4或2.3.0或2.3.4
、
、
、
、
我无法使用Python语言中
的
以下代码
从
spark
_2.4.4结构化流连接到kafka_2.12-2.3.0。我
的
scala版本是2.11.12,OpenJDK是1.8.0_222
spark
= SparkSession\ .option("subscribe", "test")\ .option("starti
浏览 17
提问于2019-10-23
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark 2.3重磅发布:欲与Flink争高下,引入持续流处理
Spark SQL,DataFrames 以及 Datasets 编程指南
教程:Apache Spark SQL入门及实践指南!
看SparkSQL如何支撑企业级数仓
微软SQL Server 2019 全新发布,更新内容亮点都在这里了
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券