spark连接mysql_spark 远程连接mysql_spark sql连接mysql - 腾讯云开发者社区

、、、

我使用Spark来查询配置单元，然后进行转换。我的Scala应用创建了多个Spark应用。只有在关闭前一个spark应用的SparkSession和Spark上下文后，才会创建新的Spark应用。但是，在停止sc和spark时，不知何故，与Hive Metastore (Mysql)的连接未正确销毁。对于每个，Spark App我可以看到大约5个Mysql连接被创建(旧的连接仍然活跃！)。最终，在150个打开的连接之后，Mysql开始拒绝新连接。如何强制spark关闭到Mysql的Hive metastore连接(在spark.stop()和sc.stop()之后)？注意:我使用的是Spa

浏览 23提问于2017-08-15得票数 0

1回答

如何使用我们的--jars选择spark库？

、、、

有多个版本的mysql连接库。 /usr/share/java/mysql-connector-java-5.1.46.jar /usr/share/java/mysql-connector-java.jar /usr/share/java/mariadb-connector-java.jar /usr/share/java/mysql-connector-java-8.0.24.jar I added external jar library blow path. (spark-default.xml) - spark.driver.extraClassPath : ~~~:/usr/

浏览 19提问于2021-05-31得票数 0

4回答

可以从Spark SQL连接到TeraData并在其上运行查询吗？

、、

到目前为止，我已经能够使用spark SQL连接并运行Mysql数据库查询，使用Mysql JDBC驱动程序将其注册为spark Data frame。可以从Spark SQL连接到TeraData并在其上运行查询吗？

浏览 0提问于2015-05-04得票数 1

1回答

在GKE上部署时，Spark无法连接到mysql

、、、

我正在GKE上的Kubernetes上部署一个批处理spark作业。Job试图从MySQL (Google Cloud SQL)获取一些数据，但它给出了连接链接故障。我尝试通过从pod安装mysql客户端来手动连接到mysql，连接正常。我还需要配置什么吗？例外： Exception in thread "main" com.mysql.cj.jdbc.exceptions.CommunicationsException: Communications link failure The last packet sent successfully to the server

浏览 15提问于2019-10-21得票数 0

1回答

如何从jdbc连接创建spark数据库

我使用的是spark，我想创建查询来连接数据库中的不同表。 Apache和connection已经在使用示例： CREATE TEMPORARY VIEW jdbcTable USING org.apache.spark.sql.jdbc OPTIONS ( url "jdbc:mysql://XXX.XXX.XXX.XXX/mydatabase", driver "com.mysql.cj.jdbc.Driver", dbtable "mydatabase.mytable1", user "XXXX", pa

浏览 3提问于2022-03-24得票数 0

回答已采纳

2回答

从mysql读取火花外壳中的数据

、、

首先，我构建了scala应用程序，使用这一行代码从apache中的mysql表中读取数据。 val spark = SparkSession.builder().master("local").appName("Fuzzy Match Analysis").config("spark.sql.warehouse.dir","file:///tmp/spark-warehouse").getOrCreate() import spark.implicits._ var df = spark.read.format("jdbc

浏览 2提问于2017-10-02得票数 1

1回答

火花MySql连接器缸

、、

我正在从spark应用程序连接到一个MySql DB (星火-2.0.0-bin-hadoop2.7)。当连接时，我得到以下错误。这是我的代码： def main(args: Array[String]) { val conf = new SparkConf() .setAppName("LoadMySql") .setMaster("local[*]") .set("spark.sql.warehouse.dir", "file:///C:/temp") val spark = Sp

浏览 1提问于2018-09-25得票数 0

1回答

使用PySpark连接Mysql，但返回“要求失败:驱动程序无法打开JDBC连接”

、、、

我在AWS EMR上运行一个星火应用程序。我尝试使用Spark连接到MySQL数据库，如下所示： with SparkSession.builder.appName('My test spark').getOrCreate() as spark: dataframe_mysql = spark.read.format('jdbc').options( url='mydb.host.com', driver='com.mysql.cj.jdbc.Driver', dbtable

浏览 11提问于2022-06-27得票数 0

回答已采纳

1回答

java.sql.SQLException:其他错误:在使用mysql-连接器-java5.1.6连接器连接到数据库时，请求过时

、、、、

在使用TIDB通过Spark连接到mysql-connector-java 5.1.6 connector时获取以下错误。请注意，我使用并行连接选项创建了jdbc连接，其中我们指定了列名、下限、上限和分区数。 Spark然后将其分解为(分区数目)查询，将列名的下限和上界划分为相同的大小。 java.sql.SQLException: other error: request outdated. at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1055) at com.mysql.jdbc.SQLError.createS

浏览 2提问于2018-10-05得票数 0

回答已采纳

1回答

码头-所有火花-笔记本通讯链接故障

、、、、

我刚开始使用码头和火花。我的docker-compose.yml文件是 volumes: shared-workspace: services: notebook: image: docker.io/jupyter/all-spark-notebook:latest build: context: . dockerfile: Dockerfile-jupyter-jars ports: - 8888:8888 volumes: - shared-workspace:/opt/workspace Docke

浏览 7提问于2022-04-05得票数 1

回答已采纳

2回答

从远程机器到MySql的JDBC连接

、、

我已经在Linux (在windows桌面)上安装了MySql，我正在尝试从运行在父windows操作系统上的Spark应用程序连接到MySql。在连接过程中，我遇到以下错误... 以下是示例代码 def main(args: Array[String]) { val conf = new SparkConf() .setAppName("LoadMySql") .setMaster("local[*]") .set("spark.sql.warehouse.dir", "file:///C:/temp") val spark

浏览 0提问于2018-09-26得票数 0

1回答

为什么对于--jars选项，spark-submit会出现“无法从JAR加载主类”的错误？

我在pycharm终端中尝试了这个命令，以连接到mysql服务器。 $SPARK_HOME/bin/spark-submit –-jars /Users/akay_nation/Desktop/spark/jars/mysql-connector-java-8.0.19 abc.py 但是当运行这个命令时，我得到了这个错误： Exception in thread "main" org.apache.spark.SparkException: Cannot load main class from JAR file:/Users/akay_nation/PycharmProj

浏览 130提问于2020-04-06得票数 0

0回答

spark-sql表或视图未找到错误

、、

我正在尝试使用spark-sql和JDBC运行一个基本的java程序。我遇到了以下错误。不知道这里出了什么问题。我读过的大多数材料都没有讨论需要做些什么来解决这个问题。如果有人能给我推荐一些关于Spark-sql (Spark-2.1.1)的好材料，那就太好了。我计划使用spark来实现ETL，连接到MySQL和其他数据源。线程"main“org.apache.spark.sql.AnalysisException异常:未找到表或视图：myschema.mytable；第1行pos 21； String MYSQL_CONNECTION_URL = "jdbc:my

浏览 13提问于2017-06-09得票数 5

回答已采纳

1回答

错误:使用Spark写入TiDB时，GC生存期短于事务持续时间

我正在使用Apache Spark批量写入数据。批次为1天。在运行spark作业时，我得到了这个错误。我正在使用MySQL java连接器连接到TiDB集群。Spark为写入创建了144个并行任务。 java.sql.SQLException: GC life time is shorter than transaction duration at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1055) at com.mysql.jdbc.SQLError.createSQLException(SQLErro

浏览 7提问于2018-11-13得票数 0

2回答

如何将星火DataFrame与MySQL结合使用

、、

好的，我知道我可以使用jdbc连接器使用以下命令创建DataFrame： val jdbcDF = sqlContext.load("jdbc", Map("url" -> "jdbc:mysql://localhost:3306/video_rcmd?user=root&password=123456", "dbtable" -> "video")) 但是我得到了一个错误：java.sql.SQLException: No suitable driver found for ... 我尝试使

浏览 3提问于2015-03-22得票数 0

回答已采纳

1回答

Docker容器无法连接到运行在主机上的mysql

、

我有一个码头集装箱正在运行。当我登录到容器并尝试使用python连接器连接到MySQL时，我无法连接。在更改主机系统上运行MySQL的绑定地址属性后，我试图使用内部IP进行连接。错误 mysql.connector.errors.DatabaseError: 2003 (HY000): Can't connect to MySQL server on '****' (113) Count2.py import mysql.connector cnx = mysql.connector.connect(user='root', password='

浏览 5提问于2020-05-13得票数 1

1回答

sq.read.jdbc和sq.read.format('jdbc')有什么区别？

、、、

我正在处理与本地mysql实例的Spark连接。我有一个mysql正在传递： pyspark --jars /path/to/jar ANd我创建了我的SQLContext等等，我开始做连接的东西，一个版本抛出和错误，而另一个版本没有。 SQLContext.read.jdbc(url="jdbc:mysql://localhost:3306?user=root", table="spark.words") 这会引发驱动程序找不到错误。 SQLContext.read.format("jdbc").option("url",&#

浏览 3提问于2016-06-15得票数 1

回答已采纳

1回答

Pyspark读取jdbc会产生错误。怎么修？

、、、、

我正在使用JDBC连接到RDS MySQL中。我已经尝试了几乎所有我在Stackoverflow上找到的调试，但我仍然无法使它工作。 spark = SparkSession.builder.config("spark.jars", mysql_jar) \ .master("local[*]").appName("PySpark_MySQL_test").getOrCreate() df= spark.read.format("jdbc").option("url", "jdbc:

浏览 0提问于2021-09-17得票数 0

1回答

使用Python从MySQL数据库表中读取SparkSQL

、、

我在MySQL中有一个'user‘表。我想把它读到我的Spark SQL程序中。如何使用Python将表从MySQL读取到Apache Spark的SparkSQL模块？有没有可以用来完成这个任务的连接器？谢谢。

浏览 0提问于2016-04-25得票数 12

2回答

Spark Shell使用spark-defaults.conf将多个驱动程序/Jars添加到类路径中

、、、

我们正在使用Spark-Shell REPL模式来测试各种用例，并连接到多个源/宿我们需要在spark-defaults.conf文件中添加自定义驱动程序/ jars，我已经尝试添加多个用逗号分隔的jars 喜欢 spark.driver.extraClassPath = /home/sandeep/mysql-connector-java-5.1.36.jar spark.executor.extraClassPath = /home/sandeep/mysql-connector-java-5.1.36.jar 但是它不工作，谁能提供正确的语法细节

浏览 0提问于2019-09-10得票数 0

1回答

如何在Spark-streaming中连接MySQL数据库？

、

在JdbcRDD和DataFrames的情况下，我可以连接Mysql数据库。但是，如何在Spark-streaming中连接MySQL数据库呢？谢谢。

浏览 0提问于2016-06-07得票数 0

1回答

如何在读取JDBC连接时使用谓词？

、、、

默认情况下，spark_read_jdbc()将整个数据库表读入Spark。我使用了以下语法来创建这些连接。 library(sparklyr) library(dplyr) config <- spark_config() config$`sparklyr.shell.driver-class-path` <- "mysql-connector-java-5.1.43/mysql-connector-java-5.1.43-bin.jar" sc <- spark_connect(master = "local",

浏览 2提问于2017-08-01得票数 5

回答已采纳

1回答

如何通过Spark python连接启用MySql的SSL Rds？

、、、、

如何通过Spark python连接到MySql Rds？我们可以在没有ssl的情况下连接到Mysql RDS。有人能告诉我们需要做什么配置吗？

浏览 10提问于2017-12-14得票数 0

2回答

java.lang.ClassNotFoundException: com.mysql.jdbc.Driver在亚马逊电子病历上的木星笔记本

、、、、

在尝试从EMR木星笔记本连接RDS中的MySql数据库时，我发现了以下错误：所用代码： from pyspark.sql import SparkSession hostname="hostname" dbname = "mysql" jdbcPort = 3306 username = "user" password = "password" jdbc_url = "jdbc:mysql://{0}:{1}/{2}?user={3}&password={4}".format(hostname,jdbcP

浏览 5提问于2020-04-23得票数 0

回答已采纳

1回答

使用jdbc触发执行

、、、、

在Spark dataframe中，假设我从oracle获取数据，如下所示。查询会完全在oracle中发生吗？假设查询很大。那么，这对oracle来说是一种开销吗？更好的方法是读取单独的dataframe中的每个过滤表数据，并使用Spark SQL或dataframe连接它，以便在spark中进行完整的连接？你能帮个忙吗？ df = sqlContext.read.format('jdbc').options( url="jdbc:mysql://foo.com:1111", dbtable="(SELECT * FROM abc,bcd....

浏览 8提问于2020-09-17得票数 0

3回答

在shell脚本中运行spark-shell命令

、、

#!/bin/sh spark-shell import org.apache.spark.sql.SparkSession val url="jdbc:mysql://localhost:3306/slow_and_tedious" val prop = new java.util.Properties prop.setProperty("user",”scalauser”) prop.setProperty("password","scalauser123") val people = spark.read.jdbc(url,

浏览 1提问于2017-04-17得票数 2

回答已采纳

2回答

如何从主机接入MySQL Docker镜像？

、

我正在运行MySQL Docker镜像并创建数据库和表。使用以下命令加载容器： docker run --network host -p 3306:3306 --name mysql -e MYSQL_ROOT_PASSWORD=root -d mysql/mysql-server Spark在我的主机上运行，所以我想将Spark中的数据写入容器中运行的数据库中。但是连接没有成功，我得到了一个异常： com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure

浏览 1提问于2019-12-11得票数 1

1回答

将MySQL和PostgreSQL连接器添加到Apache环境中

、、

在我的程序中，我需要MySQL和PostgreSQL连接器。我已经下载了这两个连接器，我可以一个一个地运行它们；当我尝试运行两个连接器时，都失败了。我只使用以下命令运行MySQL连接器： ./spark-submit --driver-class-path /home/mysql-connector-java-5.1.37-bin.jar --class learner.run.package --master local[8] --executor-memory 8G /home/project_2.10-1.0.jar 当我想将PostgreSQL连接器添加到我的类路径时，我用--ja

浏览 2提问于2016-05-29得票数 2

回答已采纳

4回答

AWS不允许glueContext查询

、

我想使用AWS胶水作业从Mysql实例中读取过滤过的数据。由于胶水jdbc连接不允许我按下谓词，所以我试图在代码中显式创建jdbc连接。我想使用jdbc连接对Mysql数据库运行一个select查询和where子句，如下所示 import com.amazonaws.services.glue.GlueContext import org.apache.spark.SparkContext import org.apache.spark.sql.SparkSession object TryMe { def main(args: Array[String]): Unit = {

浏览 1提问于2019-01-08得票数 5

回答已采纳

2回答

将亚马逊EMR星火与MySQL连接(写入数据)

、、、、

我有一个潜在的愚蠢的问题，我实际上解决了这个问题时运行星火在本地，但没有能够解决当运行它在AWS EMR。基本上，我提交了一个pyspark脚本，用于读取数据、操作它、将其处理为Spark，并将其写入我已经托管在AWS其他地方的MySQL表中。这是EMR 5.6，星火2.1.1 我下载了MySQL连接器的最新驱动程序(“mysql-连接器-java-5.1.42-bin.jar”)，并将它们与主节点放在我的实例中(基本上将其下载到本地笔记本上，然后使用scp将其放在主节点中)。然后，我在/etc/spark/conf下找到了我的闪烁-defaults.conf文件，并编辑了以下参数： s

浏览 2提问于2017-06-28得票数 4

回答已采纳

1回答

spark 1.6.1 -- hive-site.xml --未连接到mysql

、

以下是我们拥有的版本 Spark 1.6.1 Hadoop 2.6.2 Hive 1.1.0 我在$SPARK_HOME/conf目录中有hive-site.xml。hive.metastore.uris属性也配置正确。 <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://host.domain.com:3306/metastore</value> <description>metadata is st

浏览 1提问于2017-03-16得票数 1

1回答

将PySpark数据复制到MySQL

、、

我正在尝试将用PySpark在DataBricks中创建的数据文件加载到MySql，但它告诉我： com.mysql.cj.jdbc.exceptions.CommunicationsException：通信链路故障 df_videojuegos.select("Nombre", "Plataforma", "Año", "Genero", "Editorial", "Ventas NA", "Ventas EU", "Ventas JP", "Ventas

浏览 6提问于2022-11-04得票数 0

回答已采纳

1回答

试图加载jar和外部类

、、、

在我的zeppelin-env.sh中，我以jar方式加载一个JDBC MySQL连接器，如下所示 export ZEPPELIN_JAVA_OPTS+=" -Dspark.jars=/usr/local/opt/mysql-connector-java/libexec/mysql-connector-java-5.1.32-bin.jar" 此外，我还想加载Databricks CSV包，它应该以2种(或更多)方式工作： %dep z.load("com.databricks:spark-csv_2.10:1.2.0") export SPARK_SU

浏览 3提问于2015-11-11得票数 0

回答已采纳

2回答

火花仓库与蜂巢仓库

、、、

Hortonworks数据平台HDP 3.0有spark 2.3和Hive 3.1，默认情况下spark 2.3应用程序(pyspark/ Spark sql等)使用spark数据仓库，而Spark 2.3使用Hive Warehouse连接器与Apache Hive集成。我可以在蜂巢转移(MySQL)中看到两个默认的数据库。一个指向蜂巢位置，另一个指向火花位置。 mysql> SELECT NAME, DB_LOCATION_URI FROM hive.DBS; +--------+--------------------------------------------------

浏览 1提问于2018-10-29得票数 3

回答已采纳

1回答

关闭Spark中的MYSQL JDBC连接

、、、、

我正在通过JDBC将数据从MYSQL服务器加载到Spark，但我需要在加载数据后关闭该连接。关闭连接的确切语法是什么？ df_mysql = sqlContext.read.format("jdbc").options( url="jdbc:mysql://***/****”, driver="com.mysql.jdbc.Driver", dbtable="((SELECT jobid, system, FROM Jobs LIMIT 500) as T)", user=“*****”, password=“***

浏览 13提问于2016-09-17得票数 1

3回答

我们可以在spark sql中执行传统的连接查询吗

、

假设我有两个表，table1和table2。形成的查询类似于：select * from table1 inner join table2 on table1.id = table2.id; 现在，当我们通过这个code.How加载spark数据库连接时，我们可以提到两个表，这样就可以触发一个连接吗？供参考的代码 spark.read().format("jdbc").option("url", "jdbc:mysql://localhost:3306/databasename") .option("driver",

浏览 3提问于2018-09-11得票数 0

1回答

从sparklyr和/或pyspark连接到mysql

、、、

我正在尝试连接到本地托管的mysql数据库。我尝试了两个系统-R和Python。这是我的套装.profile的屏幕截图和.bash_profile 以下是我所做的：试着将火花放电连接到本地mysql，我得到了错误，请参见下面的跟踪错误。 Py4JJavaError跟踪(最近调用) in () 5 sparkClassPath = os.getenv('SPARK_CLASSPATH‘)，'/Users/me/mysql-connector-java-8.0.11/mysql-connector-java-8.0.11.jar') 6 sql

浏览 0提问于2018-05-17得票数 0

2回答

如何用pycharm连接spark与mysql

、、、、

我尝试从mysql数据库中选择一个表内容到dataframe，然后按照以下步骤与mysql连接。下载mysql-connector-java-5.0.8-bin.jar 我把mysql-connector-java-5.0.8-bin.jar放在path $SPARK_HOME/bin/mysql-connector-java-5.0.8-bin.jar上，但它仍然不起作用代码： from pyspark import SparkContext from pyspark.sql import SQLContext, Row sc = SparkContext() sqlc

浏览 1提问于2016-06-24得票数 0

1回答

如何在不知道数据库表模式的情况下按分区加载到spark中

、

我正在尝试使用JDBC连接将一个4000万大表加载到spark中。显然，分区加载就是这个问题的答案。问题是我不知道需要装载的表的模式，也不知道按哪个列进行分区。那么我如何从spark内部确定这一点呢？ val s_log = spark.read.format("jdbc").option("driver", "com.mysql.jdbc.Driver") .option("url", "jdbc:mysql://impused?user=***&password=***") .option("

浏览 11提问于2019-06-26得票数 1

2回答

MySql驱动程序找不到Scala程序

、、、

我是Scala的新手，正在尝试使用Spark从mysql数据库中读取数据。不管我做什么，我都面临着一个没有发现的例外。我试着在没有火花的情况下连接，使用Squeryl，S杯等等。总是同样的问题。下面是我尝试过的一个例子： logger.info("Write part") val dataframe_mysql = spark.sqlContext .read.format("jdbc") .option("url", s"jdbc:mysql://${datamart_server}:3306/vol") .opt

浏览 0提问于2019-03-04得票数 0

回答已采纳

4回答

如何从Google中读取和编写本地MySQL服务器8？

、、、

我一直在尝试用Google的pyspark在Windows10上的本地主机上编写/读取MySQL服务器8.0.19的表。还有很多类似的问题，也有一些建议的答案，但这些解决方案在这里似乎都行不通。这是我的代码： <...installations ...> from pyspark.sql import SparkSession spark = SparkSession\ .builder\ .appName("Word Count")\ .config("spark

浏览 14提问于2020-05-28得票数 0

回答已采纳

2回答

星星之火没有找到com.mysql.jdbc.Driver类的注册驱动程序。

、、、、

我使用的是CDH5.7.0和PySpark。当我运行RDD.count()这样的操作时，它会显示错误:找不到com.mysql.jdbc.Driver类的已注册驱动程序以下是步骤吡火花-驱动-类-路径/usr/share/java/mysql-连接器-java.jar(/usr/share/java/mysql-连接器-java.jar在每个节点上) >>>url ="jdbc:mysql://host/spark?user=root&password=test" >>> stock_data=sqlContext.read.fo

浏览 4提问于2016-05-19得票数 2

回答已采纳

1回答

如何使用Spark对MySQL (JDBC)执行join？

、、、

我想通过Spark从MySQL中读取数据。我看到的API能够从特定表中读取数据。像这样， val prop = new java.util.Properties prop.setProperty("user", "<username>") prop.setProperty("password", "<password>") sparkSession.read.jdbc("jdbc:mysql://????:3306/???", "some-table", prop) 现在，

浏览 1提问于2016-11-21得票数 2

4回答

从星火连接到mysql

、

我正试着按照这里提到的指示..。而这里..。我用的是火花码头的图像。 docker run -it -p 8088:8088 -p 8042:8042 -p 4040:4040 -h sandbox sequenceiq/spark:1.6.0 bash cd /usr/local/spark/ ./sbin/start-master.sh ./bin/spark-shell --driver-memory 1G --executor-memory 1g --executor-cores 1 --master local 这项工作如预期的那样： scala> sc.par

浏览 5提问于2016-09-11得票数 0

1回答

Spark中的多个MySQL服务器连接器

、

我们有一个场景，其中我们必须连接来自不同来源的多个表。例如，我们有 table1，来自mysql1的table2 table3，来自mysql2的table4 table5来自mysql3 table6，table7，table8来自蜂巢我们希望在同一个查询中加入所有表。如何为所有MySQL连接制作单个连接器？ val jdbcDF = spark.read.format("jdbc").options( Map("url" -> "jdbc:mysql://host1:3306/ontime?user=root&a

浏览 0提问于2019-07-11得票数 0

1回答

创建火花流上下文后将RDMS数据缓存在spark中

、、、、

我们使用火花流从卡夫卡获得数据使用createDirectStream。在同一个程序中，我连接到MYSQL，从数据库中获取一些数据。现在，我想使用spark缓存这个结果。这里的问题是，我在一开始就创建了一个星火流上下文，现在为了缓存这个MYSQL数据，我必须将其转换为一个RDD，这个RDD只有在spark上下文的帮助下才能实现，不幸的是，我不能创建spark上下文(因为已经根据spark创建了上下文)。我不想将spark.driver.allowMultipleContexts = true设置为允许JVM使用不仅仅是火花上下文，因为这可能会导致问题。是否有一种方法来缓存这个使用火花，

浏览 6提问于2016-04-08得票数 2

回答已采纳

1回答

使用windows身份验证SQL Server JDBC与pyspark

、、、、

我想问如何使用Windows身份验证将SQL Server连接到吡火花库？我可以连接到，但当我尝试用Python编写代码时，我可以这样做。下面是我迄今为止所做的尝试。 from pyspark.sql import SparkSession spark = SparkSession \ .builder \ .appName("Python Spark SQL basic example") \ .config("spark.driver.extraClassPath","mssql-jdbc-6.4.0.jre8.jar

浏览 0提问于2019-08-22得票数 3

回答已采纳

6回答

SPARK使用MySql和JDBC更新DataFrames表

、、

我试图使用Spark、DataFrames和JDBC连接在MySql上插入和更新一些数据。我已经成功地使用SaveMode.Append插入了新数据。是否有方法从Spark更新MySql表中已经存在的数据？我要插入的代码是： myDataFrame.write.mode(SaveMode.Append).jdbc(JDBCurl,mySqlTable,connectionProperties) 如果我更改为SaveMode.Overwrite，它将删除完整的表并创建一个新的表，我正在寻找类似于MySql中可用的“关于重复键更新”的内容

浏览 11提问于2016-02-25得票数 32

回答已采纳

3回答

星星之交命令，包括mysql连接器

、、、

我有一个scala对象文件，它在内部查询mysql表，进行连接并将数据写入s3，在本地测试我的代码--运行非常好。但是，当我将其提交到集群时，它会抛出以下错误：线程"main“中的异常: java.sql.DriverManager.getDriver(DriverManager.java:315) at org.apache.spark.sql.execution.datasources.jdbc.JdbcUtils$$anonfun$2.apply(JdbcUtils.scala:54) at org.apache.spark.sql.execution.datasources

浏览 6提问于2016-12-14得票数 0

2回答

Spark安装: spark-2.0.0-bin-hadoop2.7/lib/spark-assembly-*.jar:没有这样的文件或目录

、

你能指导我在本地机器上升级我的spark版本吗？我想运行在Hadoop2.7和hive 1.2.1上(mysql中的metastore)。我使用的是旧的spark 1.5版本，我想升级到新的2.0版本。我已经下载了二进制文件'spark-2.0.0-bin-hadoop2.7.tgz‘并将其压缩。我在spark-env - HADOOP_HOME中添加了HADOOP_CONF_DIR。SPARK_CLASSPATH指向mysql-connector jar文件。在spark-default中添加了spark.sql.warehouse.dir、spark.sql.hive.meta

浏览 5提问于2016-09-01得票数 3