腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
Spark
/
PySpark
删除
雪花
目标
表
、
、
、
、
我正在尝试
删除
我在Databricks平台中
使用
Pyspark
创建的
目标
雪花
表
。 任何帮助的人,我找不到任何解决方案。
浏览 13
提问于2019-12-10
得票数 1
回答已采纳
1
回答
使用
spark
读取
雪花
表
时遇到classnotfound异常
、
、
、
我正在试着读一张
spark
-shell的
雪花
表
。为了做到这一点,我做了以下工作。
pyspark
--jars
spark
-snowflake_2.11-2.8.0-
spark
_2.4.jar,jackson-dataformat-xml-2.10.3.jar>>> sc = SparkContext("local
浏览 39
提问于2020-07-17
得票数 0
回答已采纳
2
回答
使用
spark
连接器从snowflake自定义数据类型映射
、
、
、
使用
snowflake
spark
连接器从snowflake复制表时,默认行为是将结构化数据映射到
spark
字符串:https://docs.snowflake.net/manuals/user-guide/
spark
-connector-use.html#from-snowflake-to-
spark
-sql 例如,给定snowflake中的一个
表
: create table schema.tableas ar
浏览 26
提问于2019-05-30
得票数 1
1
回答
在阅读电火花数据时过滤
雪花
表
的行
、
我有一张巨大的
雪花
桌。我想在桌面上做一些转换。我的
雪花
表
有一个名为“快照”的列。我只想读取
pyspark
中的当前快照数据,并对过滤后的数据进行转换。那么,是否有一种方法可以应用于在中读取
雪花
表
时对行进行过滤(我不想在内存中读取整个
雪花
表
,因为它没有效率),还是需要读取整个
雪花
表
(在中),然后应用筛选器获取以下内容的最新快照?SNOWFLAKE_SOURCE_NAME = "net.snowflake.<em
浏览 2
提问于2022-03-16
得票数 0
回答已采纳
4
回答
编写与
雪花
连接的
Pyspark
代码时所遇到的错误
、
、
当我试图从朱庇特笔记本中编写
PySpark
代码与
雪花
连接时,我遇到了一个错误。这是我遇到的错误:星星之火版本: v2.4.5主版:本地* Python 3.Xfrom
pyspark
import SparkConf, SparkContext from
pyspark</em
浏览 8
提问于2020-06-25
得票数 5
回答已采纳
2
回答
将数据从火花加载到
雪花
中
、
我正试图将数据从火花加载到
雪花
中。雪片的负荷是利用火花发动机还是它的完全向下推到
雪花
? 谢了,纳维德
浏览 2
提问于2020-05-07
得票数 0
回答已采纳
1
回答
没有SQLContext的
pyspark
中的clearCache
、
、
、
考虑到SQLContext的
pySpark
documentation说“从
Spark
2.0开始,这将被SparkSession所取代。”
如何
在不
使用
SQLContext的情况下从内存缓存中
删除
所有缓存
表
?例如,其中
spark
是SparkSession,sc是sparkContext from
pyspark
.sql import SQLContext SQLContext(sc,
spark
).clearCache
浏览 20
提问于2019-05-04
得票数 3
回答已采纳
1
回答
雪花
-保持
表
与s3外部阶段同步的最佳实践
、
、
我们想把我们的源
表
从s3外部阶段摄取到
雪花
中。为此,我们必须考虑到达s3桶中的新文件、现有文件中的更新以及在某些情况下行
删除
。到目前为止,我们正在评估三种方法:
表
的完整
删除
和复制(简单但较少的performant)copy命令,它将捕获新的和更新的文件,然后执行合并查询,根据特定的用例去重复甚至
删除
行(可以解决,但我们需要维护更复杂的合并和
删除
逻辑)在外部s3阶段之上
使用
外部
表
,并在外部
表
之上物化视图,以提高查询性
浏览 10
提问于2022-05-18
得票数 1
1
回答
用Df.Show实现火花放电
雪花
连接器的误差
、
、
、
我相信该查询正在正确加载,但一旦我
使用
df.show()或df.write.csv,我就会得到以下错误。我似乎不知道是什么引起了这个问题。任何洞察力/指导都将不胜感激!java.lang.ClassLoader.loadClass(ClassLoader.java:418)示例代码 sfOptions = ConnectToSnowflake(creds_path='c
浏览 8
提问于2020-02-26
得票数 0
回答已采纳
1
回答
如何
在
Pyspark
Snowflake Connector中
使用
清除选项?
、
、
如何
在
pyspark
-snowflake连接器选项中
使用
清除选项?我正在
使用
以下配置- df.write.mode('overwrite') \ .options(sfURL.option('purge', 'off') \ .save() 但似乎每次我
浏览 23
提问于2021-07-02
得票数 0
1
回答
Spark
2.0 -
pyspark
2数据帧--“唯一标识生成”
、
、
、
、
将
spark
2.0与
pyspark
一起
使用
。在
目标
表
中,希望创建唯一的row_ids,它将是唯一递增的,并且不应重复。示例代码SouceDf.registerastemptable (souceDf)
Spark
.sql
浏览 0
提问于2018-06-15
得票数 0
1
回答
在写“
雪花
”之前保存火种数据
、
、
我在
PySpark
中工作,在得到最终输出
表
之前,我会进行一系列转换并应用用户定义的函数,然后编写给
雪花
。最后一条写到
雪花
的命令需要25分钟才能运行,因为它也在执行所有的计算,因为斯派克的评估很懒惰,直到最后一次调用才会进行评估。我希望在前面的步骤中对最后一个
表
进行评估,这样我就可以计时所有的转换需要多长时间,然后分别花多长时间编写
雪花
步骤。我怎样才能把这两者分开?final_df.show() temp.write.format(SNOWFLAKE_SOURCE_NAME).opti
浏览 4
提问于2020-07-28
得票数 1
回答已采纳
1
回答
数据库.从
雪花
到数据库的读
表
、
、
、
、
我在Databricks到
雪花
上看到了一些问题,但我的问题是
如何
将一个
表
从
雪花
到Databricks。到目前为止我所做的:创建一个集群并将集群附加到我的笔记本上(我正在
使用
Python)user =sfPassword": password, "sfSchema": "PUB
浏览 2
提问于2021-09-29
得票数 1
回答已采纳
2
回答
使用
雪花
火花连接器获得零指针异常
、
、
、
并尝试
使用
雪花
火花连接器和jdbc驱动程序访问
雪花
。jdbc:
雪花
-jdbc-3.12.4.jar火花-连接器:火花-
雪花
_2.11-2.7.0-火花_2.4.jarsfOptions = { "sfURL" : "{}.snowflakecomputing.com文件"/apps/shared/
spark
/python/lib/
pyspark
.zi
浏览 4
提问于2020-04-26
得票数 2
1
回答
来自单个操作的多个作业(读、转换、写入)
、
、
、
、
目前
使用
PySpark
on 数据库、交互式集群(与一起提交作业)和
雪花
作为输入/输出数据。我的
Spark
应用程序应该从
雪花
读取数据,应用一些简单的SQL转换(主要是F.when.otherwise、窄转换),然后将其加载回
雪花
。(FYI,模式被传递给
雪花
阅读器和作家) 编辑:在编写之前,在过程的末尾也有一个排序转换。我可以理解,我只有一个
Spark
,所以假设有一个作业,所以
Spark
确实将作业命名为由sc.setJobDe
浏览 5
提问于2021-11-30
得票数 3
回答已采纳
1
回答
如何
使用
Pyspark
删除
CosmosDB顶点
、
、
因为我们可以
使用
下面的
pyspark
将数据读写到cosmosdb中, cfg = {"
spark
.cosmos.accountKey" : "xx==","
spark
.cosmos.co
浏览 17
提问于2021-08-12
得票数 0
1
回答
使用
SQLContext从火花放电中创建
雪花
表
、
我想要创建一个
雪花
表
,如下所示:import
pyspark
.sql.context import SQLContextfrom
pyspark
import SparkContext sqlContext = SQLContext(sc) sqlContext.sql
浏览 7
提问于2022-04-28
得票数 0
回答已采纳
2
回答
从数据库到
雪花
的连接
、
、
使用
Databricks笔记本,我可以从Databricks连接到“
雪花
”,并
使用
'scala‘将内容写入
雪花
中的
表
中,但
使用
'python’却无法工作。我在Databricks中添加了两个库,这有助于在Databricks和
雪花
:snowflake-jdbc-3.6.8和
spark
-snowflake_2.11-2.4.4-
spark
_2.2之间建立连接我的
目标
是
使用
Datab
浏览 3
提问于2018-08-16
得票数 4
2
回答
如何
在
雪花
中创建临时
表
、
我可以用sqlContext读取电火花数据格式中的
雪花
表
.SNOWFLAKE_SOURCE_NAME) .option("query", sql)我
如何
在
雪花</e
浏览 10
提问于2022-04-27
得票数 0
1
回答
用列列表激发SQL插入选择?
当我阅读
Spark
/Hive文档时,将插入到带有列列表的
表
中,在
Spark
2.4和更早版本中不支持。insert into output_table(fieldx, fieldy, fieldz) select cola, colb, colc from in
浏览 1
提问于2019-01-09
得票数 4
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券