腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Pyspark
从
PostgreSQL
中
删除
行
、
、
、
PySpark
如何通过执行诸如DELETE FROM my_table WHERE day = 3之类的查询来
删除
PostgreSQL
中
的
行
? SparkSQL只提供插入/覆盖记录的接口。
浏览 10
提问于2020-01-27
得票数 3
回答已采纳
1
回答
如何使用
postgreSQL
表插入csv文件内容?
、
、
、
我希望将数据
从
csv文件插入到
postgreSQL
表
中
。我编写了
从
csv文件
中
获取数据的代码,如下所示我得到了'myData‘变量
中
的文件内容,我编写了如下数据库连接。DataFrame[id: int, firstname: s
浏览 0
提问于2018-09-19
得票数 1
回答已采纳
1
回答
PySpark
sqlContext阅读postgres9.6 NullPointerException
、
、
、
尝试使用
PySpark
从
Postgres DB读取表。我设置了以下代码,并验证了SparkContext是否存在: os.environ['
PYSPARK
_SUBMIT_ARGS'] = '--driver-class-path /tmp/jars/
postgresql
-42.0.0.jar --jars /tmp/jars/
postgresql
-42.0.0.jar
pyspark</
浏览 6
提问于2017-03-09
得票数 3
回答已采纳
12
回答
使用火花放电连接到
PostgreSQL
、
、
我正在尝试用
pyspark
连接到数据库,并使用以下代码:df = sqlctx.load( user = "ScottyPippen", driver = "org.
postgresql
.Driver编辑:我正试图在我的
浏览 6
提问于2016-01-22
得票数 27
3
回答
ipython笔记本
中
Postgres数据库的
Pyspark
连接
、
、
、
我能够在一个ipython笔记本上启动
pyspark
,SparkContext作为'sc‘加载。在我的.bash_profile
中
,我有以下几个用于查找Postgres驱动程序的内容:下面是我在ipython笔记本中所做的连接到db的工作(基于 post):sqlContext = SQLContext
浏览 8
提问于2017-10-24
得票数 4
回答已采纳
1
回答
从
databricks
中
删除
postgres的记录。(火花放电)
、
、
因此,我使用
pyspark
从
databricks连接到postgres数据库,我可以阅读,我可以创建表,也可以更新它。但我无法
删除
一份记录。password", password)\.load() 此代码段将导致语法错误org.
postgresql
.util.PSQLException如何
删除
postgres
中
的记录
浏览 2
提问于2022-06-07
得票数 1
2
回答
如何在使用
PySpark
时将jdbc驱动程序添加到类路径
中
?
、
我正在运行停靠程序映像,并试图直接
从
sql数据库中提取一些数据到spark
中
。
从
我所能告诉我的情况来看,我需要将驱动程序包括在我的Classpath
中
,我只是不知道如何
从
pyspark
中
实现这一点sparkexample") \ .format("jdbc"
浏览 3
提问于2017-10-25
得票数 9
回答已采纳
1
回答
pyspark
dataframe.write()
中
的批处理大小选项不起作用
、
、
我正在尝试将数据
从
pyspark
写入
postgresql
DB。我使用了batchsize 1000,
pyspark
dataframe
中
的总数据是10000。但是在
postgresql
中进行的插入并不是批处理的。它是一个接一个地插入数据。下面的代码用于写入DB df.write.此选项对
POSTGRESQL
Db有效吗?
浏览 4
提问于2019-11-11
得票数 0
3
回答
Pyspark
可空uuid类型uuid但表达式的类型是变化的
、
、
、
给出一个具有非空uuid列和可空uuid列的表设计,如何使用Python3.7.9与Pysmack2.4.3数据table和
PostgreSQL
42.2.18.jar驱动程序进行插入?table_df = spark.read.format('jdbc) \ .option('driver', 'org.
postgresql
.Driver')在
pyspark
.sql.types
中
没有uuid类型的条目。如果没有option(
浏览 9
提问于2020-11-03
得票数 4
1
回答
Pyspark
:
从
表
中
读取数据并写入文件
、
、
、
我正在使用HDInsight spark集群来运行我的
Pyspark
代码。我尝试
从
postgres表
中
读取数据,并将其写入如下所示的文件
中
。所以我无法将DataFrame写到文件
中
。为什么"spark.read“返回DataFrameReader。这里我漏掉了什么?from
pyspark
.sql.types import *from
pyspark
import S
浏览 40
提问于2020-04-24
得票数 0
回答已采纳
2
回答
如何在Jupyter notebook
中
设置MySQL的JDBC驱动程序?
、
、
、
、
我正在尝试将一堆CSV文件逐行加载到mysql实例
中
,该实例使用
pyspark
配置在OpenShift上运行。我有一台运行着spark的Jupyter笔记本。Py4JJavaError: An error occurred while calling o89.save. if __name__ == '__main__
浏览 7
提问于2020-09-01
得票数 0
1
回答
在Dataframe
中
,如何根据条件
从
行
中
删除
列?
、
当该行上的列值为零时,我想从
行
中
删除
该列。我不想从Dataframe
中
删除
该列。仅当列值为零时,我才
从
该特定
行
中
删除
该列。我用的是
Pyspark
。
浏览 19
提问于2020-04-09
得票数 0
1
回答
如何合并clickhouse和
postgresql
查询?
我正在使用Apache zeppelin,我可以分别从postgres和clickhouse获得结果。但是我需要合并这两个查询。
浏览 31
提问于2019-01-29
得票数 1
6
回答
PySpark
下降
行
、
、
如何在
PySpark
中
从
RDD
中
删除
行
?特别是第一
行
,因为这往往在我的数据集中包含列名。通过仔细阅读API,我似乎找不到一种简单的方法来做到这一点。当然,我可以通过Bash / HDFS来完成这个任务,但我只想知道这是否可以在
PySpark
内部完成。
浏览 5
提问于2014-07-13
得票数 28
回答已采纳
1
回答
如何在postgres驱动程序中使用nextval()?
、
、
、
、
在Postgres
中
,我有一个名为"mytable“的表,其中有两个列,id (bigint)和value (varchar(255))。id使用nextval('my_sequence')
从
序列
中
获取其值。
PySpark
应用程序接受一个dataframe并使用
postgresql
(
PostgreSQL
42.1.4.jar)将数据插入到"mytable“
中
。下面是我目前如何编写
从
Pyspark
到
浏览 0
提问于2018-01-21
得票数 2
回答已采纳
1
回答
ImportError:无法导入名称'st_makePoint‘
、
、
我正在尝试使用
pyspark
在
postgresql
数据库
中
输入一些数据。postresql表中有一个字段,定义为数据类型地理(Point)。我编写了下面的
pyspark
代码来创建这个使用经度和纬度的字段。from
pyspark
.sql.functions import st_makePointdf = df.withColumn("Location", st_makePoi
浏览 0
提问于2020-08-02
得票数 0
回答已采纳
1
回答
从
Azure Synapse笔记本
中
访问
PostgreSQL
、
、
PostgreSQL
安装在Azure
中
,我希望使用Synapse记事本
从
PostgreSQL
创建表、加载/读取数据。我该怎么做呢? 尝试使用连接字符串,还有其他方法吗?
浏览 7
提问于2022-03-09
得票数 0
1
回答
在jupyter
中
运行spark.sql查询
、
、
、
我是
从
jupyter笔记本我正在朱庇特上运行这个:jardrv = '/home/statspy/
postgresql
-42.2.23.jar' from <
浏览 3
提问于2021-09-16
得票数 0
回答已采纳
1
回答
如何在jupyter笔记本中使用
pyspark
时指定驱动程序类路径?
、
、
、
我想在jupyter笔记本
中
查询一个
PostgreSQL
。我在StackOverflow上浏览了很多问题,但这些问题对我都没有用,主要是因为答案似乎过时了。我在下面的链接
中
总结了我发现的主要提示,但不幸的是,我无法让它们在我的笔记本上工作: 注意:我使用的是Spark2.3.1和Python3.6.3,如果我指定jar位置,我就可以
从
吡火花外壳连接到数据库
pyspark
--driver-class-path /home/.../
postgresql
.ja
浏览 0
提问于2018-08-09
得票数 9
回答已采纳
1
回答
Pyspark
dataframe:用给定模式编写jdbc来动态创建表
、
、
、
是否有一种方法可以像我们使用熊猫的方法那样,动态地
从
pyspark
创建具有给定模式的表。在上面的代码
中</em
浏览 4
提问于2020-06-22
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券