Spark 3.0和Cassandra Spark / Python Conenctors:在写入之前没有创建表

python、pyspark、cassandra、spark3

我目前正在尝试将我的应用程序升级到Spark 3.0.1。为了创建表，我使用cassandra-driver、Python-Cassandra连接器删除并创建表。然后，我使用spark-cassandra连接器将数据帧写入到表中。只使用spark-cassandra连接器创建和删除表并不是一个很好的选择。<em

浏览 42提问于2020-10-19得票数 1

2回答

pyspark rdd/dataframe未在cassandra中自动创建表

apache-spark、pyspark、cassandra、rdd、spark-cassandra-connector

在检查了所有找到的源之后，datastax-spark-cassandra连接器支持在cassandra中使用scala和java中的rdd自动创建表。但是即使有了这个包也不能自动创建表格。对于dataframe，我根本找不到任何选项。我刚接触pyspark和cassandra，任何帮助都是非常感谢的。尝试仅使用anguenot包作为依赖项。,com.datastax.spark:

浏览 8提问于2021-03-03得票数 2

1回答

将DataFrame写入Cassandra，使CassandraCatalogException“试图写入C* Table但缺少主键列”

pyspark、cassandra、databricks、spark-cassandra-connector

我正在尝试编写一个csv文件，存储在cassandra表中的Azure Blob存储中。我使用的是数据库。在理论上，我在创建表和编写一些数据文件方面没有问题，这两种方法都是“手工创建”并被blob存储所获取。在这两种情况下，数据块实际上都很小，只有一两行。=<table name>, keyspace=<keyspace>))试图写入C*表但

浏览 7提问于2022-09-26得票数 1

1回答

如何从现有SparkSession获取SparkConf并从获取的SparkSession创建新的SparkConf

apache-spark、cassandra、apache-spark-sql、datastax-java-driver、spark-cassandra-connector

我使用的是spark-sql-2.4.1v，spark-cassandra-connector-2.4.1v和Java。为了将dataframe写入Cassandra数据库，我创建了一个spark SparkConf conf = new SparkConf(true)我使用它来创建SparkSession，如下所示 spark = SparkSession .

浏览 149提问于2020-06-23得票数 1

回答已采纳

1回答

我不明白为什么在最后阶段没有任何保存或追加数据的操作

apache-spark、cassandra、apache-spark-sql、spark-structured-streaming、spark-cassandra-connector

foreachBatch((batchDF: DataFrame, batchId: Long) => .format("org.apache.spark.sql.cassandra，数据帧被写入cassandra表。通过UI检查最后一个阶段后，没有要执行保存/追加数据的部分。 ? 我想知道为什么它不存在，或者是我遗漏了什么。foreachBatch((batchDF: DataFrame,

浏览 10提问于2020-08-21得票数 2

回答已采纳

2回答

Pyspark :将数据帧写入Cassandra表不起作用

pyspark、datastax、spark-cassandra-connector

当我尝试通过pyspark从Cassandra表中读取数据时，它工作得很好。但是当我尝试将数据帧写入Cassandra表时，却给出了与java.lang.NoClassDefFoundError相同的Spark-Cassandra连接包。56)bin/pyspark --packages datastax:spark-cassandra-con

浏览 4提问于2019-09-27得票数 0

1回答

Spark To Cassandra:将没有空值的稀疏行写到Cassandra

scala、apache-spark、cassandra、apache-spark-sql、spark-cassandra-connector

问:如何高效地将Spark DataFrame中包含值的列写入Cassanrda？(在最小的Scala代码行中高效，而不是在Cassandra中创建一堆tombstones，让它快速运行，等等)这是可行的，但是当没有值时，&q

浏览 0提问于2018-11-06得票数 2

1回答

两个docker镜像之间的通信

docker、apache-spark、cassandra、pyspark

我有一个名为spark-docker的spark的docker镜像和卡桑德拉官方的docker镜像cassandra。我想从spark-docker运行一个spark-submit作业，它将在cassandra中写入数据。spark-docker的Dockerfile如下： FROM bde2020/spark-python-template:2.4.0-hadoop2.7 MAINTA

浏览 22提问于2019-01-23得票数 0

1回答

Cassandra Spark慢写

python、performance、apache-spark、cassandra、spark-dataframe

我正在使用Spark Cassandra连接器和python中的数据帧制作一个小的Spark应用程序，但我的写入速度非常慢。我正在从Cassandra读取一些数据到一个表中，然后对它们进行一些操作(这也会使集合变得更大)。3个运行在Docker容器中的Cassandra节点，每个节点都在运行CoreOS的不同节点上，具有2 GB的ram和2个在Digitalocean运行的内核。是否有应更改

浏览 1提问于2017-03-29得票数 4

1回答

如何使用吡火花将结构化流数据写入Cassandra表？

apache-spark、pyspark、cassandra、spark-structured-streaming、spark-cassandra-connector

这是我运行strm.py文件的终端命令无法使用URI org.apache.spark<

浏览 0提问于2020-03-04得票数 0

1回答

将星火流PySpark数据格式写入Cassandra覆盖表而不是追加

apache-spark、apache-kafka、cassandra、spark-structured-streaming、spark-cassandra-connector

我在运行一个由卡夫卡，斯派克和卡桑德拉组成的单节点集群。都在同一台机器上。我一直在跟踪()和()。用于创建kafkaspark密钥空间的CQL，后面是卡

浏览 1提问于2020-10-21得票数 0

回答已采纳

3回答

如何在没有Scala的情况下测试Spark* SQL查询*

scala、cassandra、apache-spark、datastax-enterprise、apache-spark-sql

我正在尝试弄清楚如何针对Cassandra数据库测试Spark SQL查询--有点像您在SQL Server Management Studio中所做的那样。目前，我不得不打开Spark控制台并输入Scala命令，这真的很单调乏味，而且容易出错。如何在不使用控制台或编写自己的应用程序的情况下测试spark查询？

浏览 0提问于2015-05-18得票数 2

1回答

如何使用sparkSession在数据采集卡中使用火花卡桑德拉连接器写火花放电

python、apache-spark、pyspark、cassandra、spark-cassandra-connector

我使用的是卡桑德拉数据库( cassandra )中的spark-cassandra-connector_2.11-2.3.0.jar和吡火花。我正在从一个键空间读取数据，并将其写入另一个不同的密钥空间。这两个密钥空间有不同的用户名和密码。我使用以下方法创建了sparkSession： ""&

浏览 6提问于2020-06-10得票数 1

回答已采纳

1回答

KeySpace复制引发卡桑德拉问题

apache-spark、cassandra

我使用以下命令在Cassandra中创建了表： 'NetworkTopologyStrategy: 3 } AND DURABLE_WRITES = false; 表创建成功后，我运行下面的代码将数据写入</em

浏览 0提问于2017-11-30得票数 1

3回答

启动Cassandra* python设置*

python、apache-spark、pyspark、cassandra、spark-cassandra-connector

我试着用火花做一些简单的计算卡桑德拉表，但我是相当迷路。因此，我正在运行PySpark shell:与 --packages com.datastax.spark:spark-cassandra-connector_2.11:2.0.0-M3但如果我用Python说它找不到模块。有人能给

浏览 6提问于2017-03-05得票数 1

回答已采纳

1回答

spark-cassandra-connector性能:执行器似乎是空闲的

cassandra、apache-spark、spark-streaming、spark-cassandra-connector

在我们的40个节点集群(33个spark executors/5个节点cassandra)上，使用spark-streaming，我们在cassandra表(使用.saveToCassandra)中每分钟插入大约我们得到的结果是：如果我理解正确的话，执行器S3、S14和S19有75%的时间是空闲的，并且阻止了阶段的完成……这样的资源浪费！和性能损失。以下是我的SparkContext配置文件选项： .set(

浏览 2提问于2015-09-17得票数 3

1回答

在Scala中使用Spark查询Cassandra数据

scala、apache-spark、cassandra、cassandra-3.0、spark-cassandra-connector

我试图使用Scala中的Spark查询Cassandra数据。","**.*.**.***") .set("spark.cassandra.auth.password:找不到表或视图：energydata.d emodata；第1行pos 14；项目* +- UnresolvedRela

浏览 0提问于2017-07-26得票数 0

回答已采纳

1回答

将数据帧从spark集群写入cassandra集群:分区和性能调优

scala、apache-spark、cassandra、datastax-java-driver、spark-cassandra-connector

Cloud - Cassandra集群，多个DC<code>A0</code> 在我的多租户spark集群中，对于具有20M记录的spark批量加载，以及下面的配置，我看到了许多

浏览 25提问于2020-06-08得票数 1

回答已采纳

1回答

Spark2会话用于Cassandra查询

java、apache-spark、apache-spark-sql、cassandra、spark-cassandra-connector

在Spark-2.0中，创建火花会话的最佳方法是什么。因为在Spark-2.0和Cassandra中，API已经被重新加工，本质上是反对SqlContext (也包括CassandraSqlContext)。因此，对于执行SQL- -要么我创建一个Cassandra会话(com.datastax.driver.core.Session) and use execute( " ")。或者我必须创建一

浏览 1提问于2016-12-07得票数 2

回答已采纳

1回答

Apache spark* cassandra数据帧加载错误*

apache-spark、cassandra、apache-zeppelin、spark-cassandra-connector

我有一个Spark-Cassandra加载错误。请帮帮我！ ? ? 

浏览 7提问于2020-07-10得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

pyspark rdd/dataframe未在cassandra中自动创建表

将DataFrame写入Cassandra，使CassandraCatalogException“试图写入C* Table但缺少主键列”

如何从现有SparkSession获取SparkConf并从获取的SparkSession创建新的SparkConf

我不明白为什么在最后阶段没有任何保存或追加数据的操作

Pyspark :将数据帧写入Cassandra表不起作用

Spark To Cassandra:将没有空值的稀疏行写到Cassandra

两个docker镜像之间的通信

Cassandra Spark慢写

如何使用吡火花将结构化流数据写入Cassandra表？

将星火流PySpark数据格式写入Cassandra覆盖表而不是追加

如何在没有Scala的情况下测试Spark* SQL查询*

如何使用sparkSession在数据采集卡中使用火花卡桑德拉连接器写火花放电

KeySpace复制引发卡桑德拉问题

启动Cassandra* python设置*

spark-cassandra-connector性能:执行器似乎是空闲的

在Scala中使用Spark查询Cassandra数据

将数据帧从spark集群写入cassandra集群:分区和性能调优

Spark2会话用于Cassandra查询

Apache spark* cassandra数据帧加载错误*

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐