spark rdd写入mysql_Spark RDD写入Cassandra_spark写入mysql - 腾讯云开发者社区

我正在使用Apache Spark批量写入数据。批次为1天。在运行spark作业时，我得到了这个错误。我正在使用MySQL java连接器连接到TiDB集群。Spark为写入创建了144个并行任务。(MysqlIO.java:3536) at com.mysql.jdbc.MysqlIO.sendCommand$s

浏览 7提问于2018-11-13得票数 0

1回答

java.sql.SQLException:其他错误:在使用mysql-连接器-java5.1.6连接器连接到数据库时，请求过时

、、、、

在使用TIDB通过Spark连接到mysql-connector-java 5.1.6 connector时获取以下错误。(RDD.scala:324)at org.apache.spark.rdd.MapPartitionsRDD.compute(BlockManager.scala:809) at org.apache.<em

浏览 2提问于2018-10-05得票数 0

回答已采纳

1回答

Spark将不会加载大型MySql表: Java通信链路故障-超时

、、、、

我正在尝试从mysql中获取一个相当大的表，这样我就可以使用spark/databricks进行操作。我不能让它加载到spark中--我已经尝试了更小的子集，但即使在最小的合理单元，它仍然无法加载。at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323) at org.apache.spark.rdd.RDD.iterato

浏览 2提问于2018-01-08得票数 1

1回答

spark.sql()和spark.read.format("jdbc").option("query“、"")之间有什么区别？

、、、

我假设spark.sql(查询)是在使用spark.sql时使用的，而spark.read.format("jdbc").option("query“、"")则是在使用oracle语法时使用的。

浏览 3提问于2021-08-16得票数 3

回答已采纳

1回答

Spark 2.1在读取大型数据集时挂起

、、

(RDD.scala:323)at org.apache.spark.rdd.MapPartitionsRDD.compute(RDD.scala:323)at org.a

浏览 9提问于2017-07-11得票数 3

回答已采纳

1回答

激发JDBC来读取和写入Hive

、、、

我正在尝试开发一个通用的实现来使用Spark来支持从各种符合JDBC的数据库(如PostgreSQL、MySQL、Hive等)读取/写入数据。 at org.apache.spark.rdd.RDD$$anonfun$forea

浏览 6提问于2019-11-12得票数 0

1回答

当Spark通过JDBC读取RDBMS时，是否存在参数分区？

、

:1606) at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:324) at org.apache.spa

浏览 3提问于2019-10-16得票数 0

回答已采纳

2回答

如何使用scala使用spark* streaming从HBASE表中获取数据*

、、、

我正在尝试确定一种解决方案，使用火花流从HBASE表中读取数据，并将数据写入另一个HBASE表。欢迎使用spark streaming从HBASE表检索数据的任何示例。

浏览 0提问于2018-12-11得票数 0

1回答

将PySpark DataFrames写入MySQL时的最佳实践

、、、、

对于这些管道之一，我试图将数据从PySpark DataFrame写入MySQL，并且一直遇到一些问题。这只是我的代码现在看起来的样子，但是我确实想在将来添加更多的转换，df_tsv.write.jdbc(url=mysql_url, table=mysql_table, mode="append", properties={"user&q

浏览 2提问于2021-10-28得票数 1

回答已采纳

1回答

如何在Spark* cosmosdb连接器中传递"WriteThroughputBudget“配置*

、

我正在使用spark cosmosdb连接器将数据批量写入cosmosdb容器。因为这是批量上载/写入，并且有读取操作在同一时间发生。我想通过spark连接器限制写操作使用的RU。$$anonfun$1.apply(CosmosDBSpark.scala:152) at org.apache.spark.rdd.RDD$$anonfun$mapPartitions$1$$anonfun$apply$23.apply(RDD.s

浏览 1提问于2020-12-03得票数 0

1回答

Hbase-cloudera中的Spark连接器问题: java.lang.AbstractMethodError

我正在尝试将Spark数据帧写入Hbase，但当我在同一数据帧上执行任何操作或写入/保存方法时，它会给出以下异常： { at(HBaseTableScan.scala:60) at

浏览 11提问于2019-02-21得票数 1

1回答

org.apache.spark.SparkException:任务不可序列化java

、、

我试图通过foreachpartition将结果添加到mysql中，但得到错误org.apache.spark.SparkException: Task not serializable java。(SparkContext.scala:2055) at org.apache.spark.rdd

浏览 7提问于2016-09-20得票数 2

1回答

如何加入来自mysql和Oracle的SparkSQL数据？

、

在SparkSQL中可以加入mysql和Oracle数据库中的数据吗？我试图加入他们，但在SPARK_CLASSPATH中设置多个jars (用于mysql和Oracle的jdbc驱动程序)时遇到了一些问题。这是我的代码：import sys sys.path.append("/home/

浏览 2提问于2015-12-30得票数 1

1回答

RDD在RDD中的内存使用

、、、

让我们从冲积内存中创建一个RDD。rdd2 = rdd1.map(...)第二个问题的原因是我需要加入两个大的RDD

浏览 7提问于2016-06-09得票数 0

回答已采纳

4回答

java.sql.SQLException:在将DataFrame加载到Spark中时找不到合适的驱动程序

、、、

这个问题既发生在spark-shell中，也发生在用spark-submit执行代码时。我尝试过MySQL &MySQL驱动程序，但没有成功。考虑以下样本：val url = "jdbc:mysql://localhost:3306/test" val t1 = {org.apache.spark.rdd</

浏览 2提问于2015-04-28得票数 13

回答已采纳

1回答

scala.collection.immutable.List$SerializationProxy的java.lang.ClassCastException:无法分配实例

清除写入群集中的拼板文件。获取序列化异常。由: scala.collection.immutable.List$SerializationProxy :无法将org.apache.spark.rdd.RDD.org$apache$spark$rdd$RDD$$dependencies_实例分配给java.io.ObjectStreamClass$FieldReflector.setObjFieldValues(ObjectStreamClass.java:2287

浏览 0提问于2019-05-07得票数 2

1回答

使用jdbcRDD运行本地Spark时出错

、、

我正尝试在本地运行spark作业，以将mysql表内容(在本地机器中)读取到jdbcRDD。从网上，我收集了以下源代码，并自定义读取元素表和加载所有列。<init>(JdbcRDD.scala:79)at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:2

浏览 0提问于2015-08-01得票数 0

1回答

当接收器失败并将WAL存储在s3中时，火花流无法读取预写日志记录中的数据

、

FileBasedWriteAheadLogSegment(s3n://*****/checkpoint/receivedData/20/log-1439298698600-1439298758600,13678,5069)：无法读取预先写入日志记录中的数据:168) at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:277) at org.apache.spark

浏览 2提问于2015-08-12得票数 1

1回答

无法用卡桑德拉驱动程序运行火花作业

、

" at org.apache.spark.rdd.RDD.partitions(RDD.scala:237) at org.apache.spark

浏览 1提问于2017-06-19得票数 0

回答已采纳

1回答

在Scala中使用索引将RDD激发到新的MongoDB集合

、、、

在火花提交作业(用Scala编写的.JAR)中，我需要访问现有的MongoDB，在db中创建一个新的集合，添加索引，从分布在1,000多个执行者的RDD中写入数据到集合中。现在，我使用mongo火花连接器从RDD写入，然后使用casbah创建索引。casbah -

浏览 2提问于2017-10-31得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

错误:使用Spark写入TiDB时，GC生存期短于事务持续时间

java.sql.SQLException:其他错误:在使用mysql-连接器-java5.1.6连接器连接到数据库时，请求过时

Spark将不会加载大型MySql表: Java通信链路故障-超时

spark.sql()和spark.read.format("jdbc").option("query“、"")之间有什么区别？

Spark 2.1在读取大型数据集时挂起

激发JDBC来读取和写入Hive

当Spark通过JDBC读取RDBMS时，是否存在参数分区？

如何使用scala使用spark* streaming从HBASE表中获取数据*

将PySpark DataFrames写入MySQL时的最佳实践

如何在Spark* cosmosdb连接器中传递"WriteThroughputBudget“配置*

Hbase-cloudera中的Spark连接器问题: java.lang.AbstractMethodError

org.apache.spark.SparkException:任务不可序列化java

如何加入来自mysql和Oracle的SparkSQL数据？

RDD在RDD中的内存使用

java.sql.SQLException:在将DataFrame加载到Spark中时找不到合适的驱动程序

scala.collection.immutable.List$SerializationProxy的java.lang.ClassCastException:无法分配实例

使用jdbcRDD运行本地Spark时出错

当接收器失败并将WAL存储在s3中时，火花流无法读取预写日志记录中的数据

无法用卡桑德拉驱动程序运行火花作业

在Scala中使用索引将RDD激发到新的MongoDB集合

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐