读取Postgresql时，Pyspark找不到表_Python:读取PostgreSQL表的关系(外键表)_如何通过pyspark读取hive分区表 - 腾讯云开发者社区

、、、

运行我的pyspark脚本： from pyspark.sql import SparkSession spark = (SparkSession") .option("dbtable", "public.""Py4JJavaEr

浏览 23提问于2021-07-16得票数 0

回答已采纳

1回答

PySpark sqlContext阅读postgres9.6 NullPointerException

、、、

尝试使用PySpark从Postgres DB读取表。/jars/postgresql-42.0.0.jar --jars /tmp/jars/postgresql-42.0.0.jar pyspark-shell' prop

浏览 6提问于2017-03-09得票数 3

回答已采纳

1回答

如何在postgres驱动程序中使用nextval()？

、、、、

在Postgres中，我有一个名为"mytable“的表，其中有两个列，id (bigint)和value (varchar(255))。PySpark应用程序接受一个dataframe并使用postgresql(PostgreSQL42.1.4.jar)将数据插入到"mytable“中。我可以看到，在读取数据()时可以调用Postgres方法，但我不确定如何调用Postgres函数(如nextval() )将数据写入Postgres。"dbtable&qu

浏览 0提问于2018-01-21得票数 2

回答已采纳

1回答

Pyspark:从表中读取数据并写入文件

、、、

我正在使用HDInsight spark集群来运行我的Pyspark代码。我尝试从postgres表中读取数据，并将其写入如下所示的文件中。from pyspark.sql.types import *from pyspark import SQLContextfrom pyspark.sql import Sp

浏览 40提问于2020-04-24得票数 0

回答已采纳

1回答

胶水HiveContext access胶DataCatalog

、、、

我可以从glueContext的胶水作业中读取在glue数据目录中定义的表。但是，如果我想使用hiveContext读取完全相同的表，则会收到一条错误消息，说明它找不到该表。您知道在胶水作业配置中插入什么(编辑作业->作业参数-> "--conf“)以确保HiveContext能够在胶水数据目录中找到和访问表吗？我想执行以下代码：from pyspark.context import Spar

浏览 12提问于2020-02-10得票数 0

1回答

如何使用postgreSQL表插入csv文件内容？

、、、

我希望将数据从csv文件插入到postgreSQL表中。url = 'postgresql://myPath'; "user": "postgres", "password":"" df = DataFrameReader(sqlCo

浏览 0提问于2018-09-19得票数 1

回答已采纳

1回答

从postgresql提取数据到pyspark dataframe时，我是否应该使用模式

、、、

我有一个从postgresql数据库中获取数据的pyspark任务。在读取数据时，我是否应该使用Schema来优化数据并加快提取速度？(据我所知，在读取数据时正常创建模式会使读取速度更快) 然后将数据转换为pandas数据帧，在此转换中，我应该指定模式还是已经优化？

浏览 0提问于2019-05-10得票数 0

1回答

如何从Pyspark更新Mysql表中的数据

、

我可以从pyspark中的mysql表中读取数据。hiveContext.read.format('jdbc').options(url=jdbc_url, dbtable=mysql_query,driver='com.mysql.jdbc.Driver').load() 但是我找不到在有没有人执行过pyspark的更新。

浏览 4提问于2016-12-17得票数 1

1回答

如何将HBase表作为pyspark数据帧读取？

、

有没有可能在不使用Hive或Phoenix或Hortonworks提供的spark-Hbase连接器的情况下直接以Pyspark Dataframes的形式读取Hbase表？我对Hbase比较陌生，找不到一个直接的Python示例来将Hbase表转换为Pyspark数据帧。我看到的大多数示例都是用Scala或Java编写的。

浏览 2提问于2017-10-05得票数 1

1回答

Pyspark :读取带有双引号和逗号字段的csv文件

我有一个csv文件，我正在通过pyspark读取并加载到postgresql中。它的一个字段包含字符串，字符串中包含coma和双引号。就像下面的例子- 1.""B"" 5" Pyspark正在解析它，如下所示。这会引起问题，因为当我将数据加载到postgresql中时，它会将值/列混为一谈，并且脚本失败。 1.如何在pyspark中处理这种情况？基本上，我想编程忽略coma或双引号，如果它是在双引号内。

浏览 105提问于2020-08-27得票数 0

1回答

ImportError:无法导入名称'st_makePoint‘

、、

我正在尝试使用pyspark在postgresql数据库中输入一些数据。postresql表中有一个字段，定义为数据类型地理(Point)。我编写了下面的pyspark代码来创建这个使用经度和纬度的字段。from pyspark.sql.functions import st_makePointdf = df.withColumn("Location", st_makePoi

浏览 0提问于2020-08-02得票数 0

回答已采纳

1回答

无法使用kubernetes中托管的Pyspark读取PSQL

、、、、

我在jupyter笔记本中使用考拉，以便执行一些转换，我需要从Azure Database for PostgreSQL中进行写入和读取。<table>", con=engine_azure) 我想使用以下代码从Pyspark读取此表： import os from pyspark import SparkContext, SparkConf'] = "--packages=org.apache.hadoop:hadoop-aws:2.7.3,o

浏览 15提问于2020-11-27得票数 0

回答已采纳

1回答

从PostgreSQL (JDBC)进行查询的分区

、、、

我在集群模式下运行spark (与pyspark一起运行)，并通过JDBC从RDBMS读取数据。我通过查询读取信息(不是直接的表)sql = (select ... )df=spark.jdbc(url=="brand_id", lowerBound=1, 不幸的是，Spark分区选项对WHERE子句在查询的末尾生成，因此P

浏览 0提问于2018-05-25得票数 0

12回答

使用火花放电连接到PostgreSQL

、、

我正在尝试用pyspark连接到数据库，并使用以下代码：df = sqlctx.load( user = "ScottyPippen", driver = "org.postgresql.Driver

浏览 6提问于2016-01-22得票数 27

2回答

pyspark.sql.utils.AnalysisException:表未找到: test_result；

、、、、

我正在尝试从S3桶中读取文件，并使用pyspark将数据写入postgresql表，但遇到了以下错误from pyspark.sql import SparkSession df.write.format("jdbc").option("driver","org.<

浏览 17提问于2022-03-29得票数 0

回答已采纳

3回答

如何使用JDBC源在(Py)星火库中读写数据？

、、、、

这个问题的目的是记录：这些方法只要做一些小的改动，就可以与其他受支持的语言一起工作，包括Scala

浏览 0提问于2015-06-22得票数 81

回答已采纳

3回答

Pyspark可空uuid类型uuid但表达式的类型是变化的

、、、

给出一个具有非空uuid列和可空uuid列的表设计，如何使用Python3.7.9与Pysmack2.4.3数据table和PostgreSQL42.2.18.jar驱动程序进行插入？table_df = spark.read.format('jdbc) \ .option('driver', 'org.postgresql.Driver')在pyspark.sql.types中没有uuid类型的条目。如果没有option(

浏览 9提问于2020-11-03得票数 4

2回答

Pyspark:从AWS:S3桶读取数据并写入postgres表

、、、

我试图从S3存储桶中读取数据，并希望将其写入/加载到postgres表中。我的密码是-spark = SparkSession.builder.appName('Read Multiple CSV Files']df1 = files.toPandas() from py

浏览 3提问于2022-03-21得票数 0

回答已采纳

1回答

Pyspark dataframe:用给定模式编写jdbc来动态创建表

、、、

是否有一种方法可以像我们使用熊猫的方法那样，动态地从pyspark创建具有给定模式的表。在上面的代码中，我们如何给出模

浏览 4提问于2020-06-22得票数 1

回答已采纳

1回答

如何从synapse数据库表中读取表

、、

但我不明白如何使用Pyspark来读取这些表。这是我的链接服务数据结构。 

浏览 5提问于2022-08-26得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云