基于spark结构流的Xml解析_基于Java的Spark结构流单元测试_Spark结构流中的临时视图 - 腾讯云开发者社区

、、、

我正在尝试使用Spark结构化流从Kafka主题读取XML数据。我试着使用Databricks spark-xml包，但是我发现一个错误:这个包不支持流读取。有什么方法可以使用结构化流从Kafka主题中提取XML数据吗？我现在的代码是： df = spark \ .readStream \ .format("kafka") \ .format('com.databricks.spark.xml') \ .options(rowTag="MainElement")\ .option(&

浏览 19提问于2017-09-01得票数 6

回答已采纳

1回答

CDH5.4.2火花可以在火花壳中使用HiveContent，但不能打开火花-sql

、、

我使用的是CDH5.4.2的火花(独立的) 在将hive-site.xml复制到$SPARK_HOME/conf之后，我可以从spark-shell中的hive查询，如下所示： org.apache.spark.sql.hive.HiveContext@6c6f3a15 scala> hiveContext =新的org.apache.spark.sql.hive.HiveContext(sc)；hiveContext: org.apache.spark.sql.hive.HiveContext = scala> hiveContext.sql(“显示表”).show()；

浏览 8提问于2016-07-26得票数 0

1回答

Spark结构化流中数据流数据的读取模式

、、、、

我是Apache结构化流的新手。我试图从事件集线器( XML格式)读取一些事件，并尝试从嵌套的XML创建新的Spark。我使用中描述的代码示例和批处理模式运行得很完美，但不是在结构化火花流中运行。星星之火的代码块-xml Github库 import com.databricks.spark.xml.functions.from_xml import com.databricks.spark.xml.schema_of_xml import spark.implicits._ val df = ... /// DataFrame with XML in column 'payloa

浏览 4提问于2021-01-21得票数 1

回答已采纳

1回答

将星火结构流DataFrames转换为Pandas DataFrame

、、、、

我有一个Streaming设置，它消耗了一个Kafka主题，我需要使用一些使用的App，但是当我试图转换它时，我得到了以下内容 : org.apache.spark.sql.AnalysisException: Queries with streaming sources must be executed with writeStream.start();; kafka at org.apache.spark.sql.catalyst.analysis.UnsupportedOperationChecker$.org$apache$spark$sql$catalyst$anal

浏览 1提问于2019-03-05得票数 3

回答已采纳

2回答

inferSchema=true不适用于csv文件读取n火花结构化流

、、、

我收到了错误信息 java.lang.IllegalArgumentException: Schema must be specified when creating a streaming source DataFrame. If some files already exist in the directory, then depending on the file format you may be able to create a static DataFrame on that directory with 'spark.read.load(directory)' a

浏览 18提问于2021-10-17得票数 4

回答已采纳

1回答

使用Kafka进行Spark流时出错

、、

当我通过spark-submit启动一个流任务时，我收到关于Kafka属性无效的警告消息： VerifiableProperties: Property auto.offset.reset is overridden to largest VerifiableProperties: Property enable.auto.commit is not valid. VerifiableProperties: Property sasl.kerberos.service.name is not valid VerifiableProperties: Property key.deserializ

浏览 0提问于2018-01-29得票数 0

1回答

是否有可能使用Spark与星火结构流的库？

、、、

我想对我从一个卡夫卡集群中获得的消息流执行tweet情绪分析，该集群反过来从Twitter v2中获取这些消息。当我尝试应用预先训练过的情感分析管道时，我会收到一条错误消息，上面写着：Exception: target must be either a spark DataFrame, a list of strings or a string，我想知道是否有办法解决这个问题。我已经检查了文档，在流数据上找不到任何东西。这是我使用的代码： import pyspark from pyspark.sql import SparkSession from pyspark.sql.functi

浏览 7提问于2022-03-23得票数 1

回答已采纳

3回答

在Xml中使用XML解析器和Xpath有什么区别

、

我想知道在XML.Because中使用Xml和Xpath有什么不同，它们都是用来获取xml中的任何信息的，所以我问了这个问题……

浏览 2提问于2011-04-12得票数 2

回答已采纳

1回答

如何收集流数据集(到Scala值)？

、

如何将dataframe值存储到scala变量？我需要将从下面的dataframe (假设列“时间戳”产生相同的值)的值存储到一个变量，稍后我需要在某个地方使用这个变量。我已经试过了 val spark =SparkSession.builder().appName("micro"). enableHiveSupport().config("hive.exec.dynamic.partition", "true"). config("hive.exec.dynamic.partition.mode",

浏览 0提问于2019-01-08得票数 0

1回答

结构化流如何动态解析kafka的json数据

、、

我正在尝试使用结构化流从Kafka读取数据。从kafka收到的数据采用json格式。我的代码如下所示:在代码中，我使用from_json函数将json转换为dataframe以供进一步处理。 val **schema**: StructType = new StructType() .add("time", LongType) .add(id", LongType) .add("properties",new StructType() .add("$app_version", StringType)

浏览 3提问于2019-10-15得票数 4

回答已采纳

1回答

如何从res/xml文件夹中加载、解析和编写.xml文件以获取游戏数据

、

可能重复：嗨。我想知道如何加载和如何从res/xml解析这个XML文件，以及如何重写这些值 <?xml version="1.0" encoding="UTF-8"?> <Rocket> <body>baby</body> <launcher>basic</launcher> <point>0</point> <money>0</money> <highest>0</highes

浏览 3提问于2011-04-08得票数 0

1回答

无法解析"createStream“中的"KafkaUtils”方法

、、、、

我试图使用Apache和Spark来流数据，但是我在代码的第24行中发现了一个错误：“无法解决”KafkaUtils“中的”KafkaUtils“方法”。我也尝试过使用KafkaUtils.createDirectStream，但这也不起作用。如何解决此错误？下面是我正在使用的文件 NumbersConsumer.java import java.util.HashMap; import java.util.Map; import org.apache.spark.SparkConf; import org.apache.spark.streaming.Duration; import org

浏览 12提问于2022-11-30得票数 0

2回答

用C#将大型XML文件处理到Server中

、、、、

首先，我在这里描述的是已经存在的更大的ETL过程的一小部分。因此，请不要建议移植到SSIS或其他环境，因为我不能。在这个ETL过程中，对于插入到的SQL server数据库中的每个表，我是：将所有相关xml加载到XElement对象中。然后将xml转换为类型化dataset datatable 然后使用SqlBulkCopy对象将数据快速插入到server表中。但是，对于一个表，当我创建XElement时，我会得到一个OutOfMemory异常。因此，我现在需要以块的形式迭代处理数据，但我不确定最好的方法是什么。xml文件存储在运行ETL进程的同一台计算机上。谢

浏览 1提问于2010-11-05得票数 0

回答已采纳

2回答

使用Spark Structured Streaming编写时捕获Kafka偏移量

、、

我在Spark 2.2上使用Spark Structured streaming将HDFS目录中的文件流式传输到Kafka主题。我想为我正在写入主题的数据捕获Kafka偏移量。我正在使用 val write = jsonDF .writeStream.format("kafka") .option("checkpointLocation", Config().getString(domain + ".kafkaCheckpoint")) .option("kafka.bootstrap.servers", Config().ge

浏览 2提问于2017-11-13得票数 3

1回答

窗口(固定、滑动等)& Spark SQL DSL中的水印支持

、、

Spark SQL ( DSL而不是API)是否支持结构化流中的窗口功能？Flink中类似的内容如下所示： SELECT user, SUM(amount) FROM Orders GROUP BY TUMBLE(proctime, INTERVAL '1' DAY), user 我在官方结构化流媒体网站上找到的唯一SQL示例是下面的，其中没有窗口功能的示例： df.createOrReplaceTempView("updates") spark.sql("select count(*) from updates") // returns

浏览 24提问于2019-03-08得票数 0

3回答

XMLStreamReader和XMLEventReader有什么区别？

、、、、

我在网上冲浪。我发现XMLStreamReader是用于解析XML的游标样式API。XMLEventReader是Iterator风格的用于解析XML.Could的API，谁能详细告诉我呢？

浏览 3提问于2016-04-19得票数 13

1回答

Spark流媒体与结构化流媒体

、、

在过去的几个月里，我使用了相当多的结构化流媒体来实现Stream Jobs (在使用了很多Kafka之后)。在阅读了“使用Apache Spark进行流处理”一书后，我有了这样一个问题:有没有什么要点或用例可以让我使用Spark流而不是结构化流？我是不是应该花点时间去了解它，或者既然我已经在使用Spark Structured Streaming了，我应该坚持使用它，并且之前的API没有任何好处。将非常感谢任何意见/见解

浏览 17提问于2020-04-06得票数 2

1回答

基于事件时间的窗口是否可以与星光流一起使用？

、、、

根据Dataflow模型文件:在大规模、无限制、无序的数据处理中平衡正确性、延迟和成本的实用方法： MillWheel和Spark流都具有足够的可伸缩性、容错性和低延迟性，可以作为合理的基板，但缺乏高层次的编程模型，使得计算事件时会话变得简单。总是这样吗？

浏览 3提问于2019-10-07得票数 0

回答已采纳

3回答

XML序列化与XML解析

、

XML序列化和XML解析之间的区别是什么？我们应该在什么时候使用每一个？

浏览 1提问于2012-08-15得票数 10

1回答

StreamingQueryException：‘描述Streams\n===流查询时出错

、、

我在运行无法连接到Kinesis数据源的胶水流式作业时遇到以下错误：错误： WARNING:root:StreamingQueryException caught. Retry number 10 ERROR:root:Exceeded maximuim number of retries in streaming interval, exception thrown Parse yarn logs get error message: StreamingQueryException: 'Error while Describe Streams\n=== Streaming Q

浏览 0提问于2020-09-08得票数 0

1回答

以Kafka为源的结构化流中的JSON模式推理

、

我目前正在使用从Kafka主题中读取json数据。json作为字符串存储在主题中。为了实现这一点，我提供了一个硬编码的JSON模式作为StructType。我正在寻找一种在流过程中动态推断主题模式的好方法。这是我的代码：(这是Kotlin，而不是通常使用的Scala) spark .readStream() .format("kafka") .option("kafka.bootstrap.servers", "kafka:9092") .option("subscribe", "my_t

浏览 2提问于2020-10-21得票数 1

回答已采纳

1回答

(Py-)火花结构流星火列车模型

、、、

我正在使用Spark3.x，我不知道如何训练一个模型，例如，使用星火结构化流，而不是火花流的随机森林分类器。我已经设置了所需的流来处理用于培训的微批，我已经设置了spark.ml管道，但是我错过了一个函数或类似于partial fit的东西。由于spark基本上是为大数据和分布式ml创建的，所以必须有这样的方法培训代码应该如下所示： (training_data, test_data) = data.randomSplit([0.7, 0.3]) pipeline = Pipeline(stages=[featureIndexerA, assembler, rf, labelConver

浏览 5提问于2022-02-23得票数 0

回答已采纳

2回答

当使用NSXMLParser解析时，它是下载整个.xml然后解析，还是进行流解析？

、、

为iPhone编程。当使用NSXMLParser解析时，它是下载整个.xml然后解析，还是进行“流”解析？本质上，如果我中途中止解析，我是节省了带宽，还是仅仅节省了cpu周期？

浏览 1提问于2009-08-15得票数 5

2回答

如何在pyspark中从kafka中以字符串格式从Confluent Schema Registry获取Avro数据？

、、、、

我正在从spark (结构化数据流)中读取Kafka中的数据，但在spark中从kafka中获取的数据不是字符串格式。火花: 2.3.4 Kafka数据格式： {"Patient_ID":316,"Name":"Richa","MobileNo":{"long":7049123177},"BDate":{"int":740},"Gender":"female"} 下面是kafka触发结构化流媒体的代码： # spark-submit --jars k

浏览 1提问于2019-12-27得票数 0

1回答

将XML文件内容发送到事件集线器并从Databricks读取

、、、、

我正在尝试将xml文件(小于100 kb)发送到Azure事件中心，然后在发送它们之后，读取Databricks中的事件。现在，我已经使用Python以字节发送XML的内容(这个步骤是工作)。但是我想要完成的下一步是从事件的“主体”中读取该XML内容，并使用PYSPARK创建一个Spark。要做到这一点，我有两个疑问： XML1-我在选项中指定事件的“主体”的内容是XML的选项吗? 2-是否有其他方法可以直接将该内容转储到Spark ? 3-在将spark.readStream作为事件发送时缺少一些配置吗？我试着像下面的例子一样： Python事件生成器 # this is the p

浏览 0提问于2021-01-20得票数 1

回答已采纳

2回答

数据源io.pivotal.greenplum.spark.GreenplumRelationProvider不支持流写入。

、、、

我试图读取卡夫卡的数据，并将其上传到格林梅利的数据库使用火花。我使用的是格林梅-火花连接器，但我正在获取数据源，io.pivotal.greenplum.spark.GreenplumRelationProvider不支持流写入。是否格林梅源不支持流媒体数据？我可以在网站上看到“连续ETL管道(流)”。我曾尝试将数据源命名为“绿梅”，并将"io.pivotal.greenplum.spark.GreenplumRelationProvider“转换为.format(”数据源“) val EventStream = spark.readStream .format("kaf

浏览 0提问于2019-04-04得票数 0

回答已采纳

1回答

验证和编组大型XML文件？

、、

我有2GB到4GB大小的大XML文件，我正在通过第三批供应商。现在，我需要为不同的用例执行两种类型的操作:- 用例1 :- 验证XML中的一些值。用例2 :- 将XML传递给java对象以进行一些处理。现在我的问题是什么是最好的方法。我可以在不解析Usecase 1的情况下验证特定的元素。第二个问题是，在没有获得OutOfMemory异常或最佳内存利用率的情况下，如何封送这么大的文件？

浏览 2提问于2014-04-15得票数 0

回答已采纳

2回答

必须使用writeStream.start()；执行流源查询；

、、、、

我试图从卡夫卡读取数据使用火花结构化流和预测形式的传入数据。我用的是我用Spark训练的模型。 val spark = SparkSession .builder() .appName("Spark SQL basic example") .master("local") .getOrCreate() import spark.implicits._ val toString = udf((payload: Array[Byte]) => new String(payload)) val sentenceDataFrame = spark

浏览 7提问于2017-10-03得票数 2

回答已采纳

1回答

什么时候(如果曾经)在失败的情况下修改流查询的检查点元数据？

、、

我对星火检查站持怀疑态度。我有火花流应用程序，我使用以下方法管理检查点n HDFS： val checkpointDirectory = "hdfs://192.168.0.1:8020/markingChecksPoints" df.writeStream .foreachBatch { (batchDF: DataFrame, batchId: Long) => batchDF .write .cassandraFormat( "table&#

浏览 3提问于2019-11-25得票数 1

回答已采纳

1回答

为什么"java.lang.ClassNotFoundException:未能找到数据源: kinesis“与火花流驱动-asl依赖？

、、、

我的设置： scala:2.11.8 spark:2.3.0.cloudera4 我已经在我的.pom文件中添加了以下内容： <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming-kinesis-asl_2.11</artifactId> <version>2.3.0</version> </dependency> 然而，当我运行我的星火流代码来使用来自kinesis的数据时，它会

浏览 2提问于2018-11-29得票数 2

回答已采纳

1回答

处理大型xml文档

、、、、

我理解作为securefile二进制xml存储的xml类型可以处理高达4GB的文件大小。我想知道是否有人知道处理大于4 GB的xml文件的好方法，包括存储在数据库中和从数据库中读取\选择数据。

浏览 2提问于2016-12-05得票数 0

1回答

xml解析将xml标记作为文本内容读取。

、

我有一个xml文件示例： <Cells> <Cell row="1" column="1">p</Cell> <Cells> P在哪里是单元格的内容。但有时我需要将内容xml标记放入其中，我希望将它们作为简单文本而不是xml标记来读取。就像这样： <Cells> <Cell row="1" column="1">p</Cell> <Cell row="2" column=&

浏览 2提问于2016-06-15得票数 0

回答已采纳

2回答

使用Spark - Spark JobServer进行实时基于请求的推荐？

、、

我们正在试图找到一种加载Spark (2.x) ML训练模型的方法，这样我们就可以根据请求(通过REST接口)查询它并获得预测，例如有一些现成的库可以将模型加载到Spark中(假设它是在使用MLWritable训练后存储在某个地方)，然后将其用于预测，但由于SparkContext的初始化，将其包装在作业中并在每次请求/调用时运行它似乎有些过分。然而，使用Spark的好处是我们可以保存我们的管道模型并执行相同的功能转换，而不必在SparkContext外部实现它。经过一些挖掘，我们发现可以潜在地帮助我们解决这个问题，它允许我们为作业服务器初始化一个“热”的spark-context，因此

浏览 1提问于2017-02-14得票数 5

1回答

如何将流数据从spark接收到Mongodb？

、、

我正在使用pyspark读取Kafka的流数据，然后我想将这些数据汇到mongodb。我已经包含了所有必需的包，但是它会引发以下错误 UnsupportedOperationException:数据源com.mongodb.spark.sql.DefaultSource不支持流写入。以下链接与我的问题无关下面是完整的错误堆栈跟踪回溯(最近一次调用)：.option("com.mongodb.spark.sql.DefaultSource"，“mongodb://localhost:27017/twitter.test”中的文件“/home/b3ds/kafka-sc

浏览 4提问于2018-06-04得票数 2

2回答

使用spark解析具有多行标记的xml

、、、

我想使用spark解析xml，所以我使用了。示例xml如下所示： <Transactions> <Transaction> <transid>1111</transid> </Transaction> <Transaction> <transid>2222</transid>

浏览 0提问于2019-09-12得票数 1

回答已采纳

3回答

如何在星火流应用程序中使用Kafka主题？

、、、

当我从Kafka主题创建一个流并打印它的内容时 import os os.environ['PYSPARK_SUBMIT_ARGS'] = '--packages org.apache.spark:spark-streaming-kafka-0-8_2.11:2.0.2 pyspark-shell' from pyspark import SparkContext from pyspark.streaming import StreamingContext from pyspark.streaming.kafka impo

浏览 2提问于2019-12-08得票数 1

回答已采纳

1回答

哪个存档文件加载得更快

、

我使用boost归档来创建档案。我有两个选择二进制格式 XML格式哪种格式读取速度更快，加载时间更短？

浏览 2提问于2020-09-18得票数 0

回答已采纳

1回答

Expat c库XML模式验证

、、

c++库解析器可以像库Libxml2那样针对XML定义(XSD)进行XML数据验证吗？很多东西！

浏览 7提问于2022-09-15得票数 0

1回答

在带有Kafka的星火结构流中，火花如何管理多个主题的偏移量

、、、、

考虑一下Spark结构化的流媒体作业，它读取来自Kafka的消息。如果我们已经定义了多个主题，那么代码如何管理每个主题的偏移量？我已经通过了KafkaMicroBatchStream类，无法得到如何如果得到的偏移为不同的主题。 def latestOffset(开始:偏移，readLimit: ReadLimit)：偏移；方法只返回一个偏移量。尝试理解实现，因为我需要编写来自多个RDBMs表的自定义源代码，每个表都有自己的偏移量。该偏移量将仅在RDBMS表中管理。

浏览 2提问于2020-12-07得票数 1

回答已采纳

2回答

如何使用dbx安装spark库

、、

我正在尝试使用spark-xml_2.12-0.15.0安装库dbx。我找到的文档包括在conf/deployment.yml文件中，如下所示： custom: basic-cluster-props: &basic-cluster-props spark_version: "10.4.x-cpu-ml-scala2.12" basic-static-cluster: &basic-static-cluster new_cluster: <<: *basic-cluster-props num_work

浏览 21提问于2022-09-12得票数 0

回答已采纳

2回答

如何摆脱org.apache.kafka.clients.consumer.KafkaConsumer.subscribe :火花流+卡夫卡中的NoSuchMethodError错误

、、、、

我想使用星火流，并连接它与卡夫卡。然而，我仍然得到了NoSuchMethodError: NoSuchMethodError错误，现在我只是不知道下一步该做什么。我的设置： Ubuntu 16.04 Scala 2.11 Kafka 2.11-1.0.0 (我也尝试使用2.11-0.10.0.0) 火花2.2.1 Hadoop 2.9.0 我甚至不能运行示例脚本： from pyspark.sql import SparkSession, Row, SQLContext from pyspark import SparkContext, SparkConf from pyspark.stre

浏览 1提问于2018-02-09得票数 3

1回答

Spark的哪个部分解析SQL语句并创建执行计划？

、

假设有以下查询： select * from my_table Spark的哪个部分解析sql并创建执行计划？ Spark执行引擎是否有自己的SQL解析器，将其转换为自己的执行模型？它是怎么工作的？有些函数还不支持它，所以我得到了异常，这是否意味着火花解析sql查询？彼此的执行引擎也是这样吗？

浏览 5提问于2017-05-29得票数 4

回答已采纳

1回答

阿帕奇火花与卡夫卡流-失踪的卡夫卡

、、、

我试着用kafka来设置Apache，并用本地语言编写了简单的程序，它失败了，无法从调试中找到答案。 build.gradle.kts implementation ("org.jetbrains.kotlin:kotlin-stdlib:1.4.0") implementation ("org.jetbrains.kotlinx.spark:kotlin-spark-api-3.0.0_2.12:1.0.0-preview1") compileOnly("org.apache.spark:spark-sql_2.12:3.0.0") imple

浏览 11提问于2021-12-26得票数 1

1回答

如何用CSV格式编写窗口聚合？

、、

我正在开发一个Spark结构化流应用程序，它可以流csv文件并将它们与静态数据连接起来。我在加入后进行了一些聚合。在以CSV格式将查询结果写入HDFS时，我得到以下错误： 19/01/09 14:00:30 ERROR MicroBatchExecution: Query [id = 830ca987-b55a-4c03-aa13-f71bc57e47ad, runId = 87cdb029-0022-4f1c-b55e-c2443c9f058a] terminated with error java.lang.UnsupportedOperationException: CSV data

浏览 0提问于2019-01-09得票数 1

回答已采纳

1回答

如何从SocketTCP获取数据以保存到Scala中的数据？

、、

--我尝试从Socket获取数据以附加到dataframe --我接收了数据并将其执行到Seq()中，但是当我使用forEach将它们附加到dataframe时，有一个问题--这是我的代码： object CustomReceiver { def main(args: Array[String]): Unit = { StreamingExamples.setStreamingLogLevels() // Create the context with a 1 second batch size val spark: SparkSession = SparkS

浏览 2提问于2021-06-21得票数 0

回答已采纳

2回答

星火抛出的Kafka无法初始化类kafka.utils.Log4jController错误

、、、

我正在尝试用java编写一个kafka用户，使用。由于某些Log4jController错误，代码没有执行。不知道我错过了什么。 pom.xml文件如下： <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.11</artifactId> <version>2.3.0</version> </dependency> <dependency> <groupI

浏览 0提问于2018-03-10得票数 1

回答已采纳

1回答

使用XML的3种方法

、

在使用XML - LINQ to XML、streaming、DOM时，我需要使用不同的方法。有人能给我举个这种方法的例子吗？我只想看看这两种方法有什么区别。

浏览 0提问于2010-10-24得票数 1

回答已采纳

1回答

结构化流Kafka 2.1->齐柏林飞艇0.8->星火2.4:火花不使用jar

、、、、

我有一个Kafka2.1消息代理，希望对Spark2.4中的消息数据进行一些处理。我想用齐柏林飞艇0.8.1笔记本进行快速原型。我下载了结构化流()所必需的星火流-kafka-0-10_2.11.jar，并将其作为“依赖-工件”添加到齐柏林飞艇( Zeppelin )的“streaming”-interpreter(也处理%pyspark段落)中。我重新启动了这个解释器(还有齐柏林飞艇)。我还把罐子装进了笔记本的第一段(我首先认为这不应该是必要的.)： %dep z.load("/usr/local/analyse/jar/spark-streaming-kafka-0-10_2.

浏览 1提问于2019-07-19得票数 5

回答已采纳

1回答

将InputStream对象转换为字符串的最佳方法

、、

我有一个InputStream对象，它包含数百万个文件信息(名称、创建日期、作者等)。以XML格式。我已经尝试过使用String方法将其转换为IOUtils.copy，但是由于该信息的大小相当大，所以在运行几分钟后，它会抛出一个java.lang.OutOfMemoryError。增加JVM内存不是一种选择，因为我收集信息的文件数量永远在增加。所以有人能建议我该怎么解决这个问题吗？

浏览 5提问于2014-09-12得票数 0

回答已采纳

1回答

如何解决阶段20.0 (TID 20)任务0.0中的错误执行器异常？

、、、、

--我知道类似的问题已经得到了简短的回答，但由于缺乏最低限度的reputation...hence，我无法在此补充我个人的怀疑--我在这里问它-- 我想使用Apache + Kafka来处理Twitter数据。我为此创造了一个模式。但是当我运行它时，我会得到以下错误。我搜索了很多关于这个错误的地方，但是我无法得到我想要的解决方案，或者它没有工作。上一次我用较小的内存空间运行Spark时，我认为内存不足，但我仍然会遇到同样的错误。这是我收到错误的代码： from kafka import KafkaConsumer from pyspark.streaming import StreamingC

浏览 2提问于2019-12-29得票数 2

回答已采纳