JSON数组解析Kafka_json数组解析_从Kafka解析嵌套json的模式 - 腾讯云开发者社区

apache-spark、pyspark、apache-kafka、spark-structured-streaming、ndjson

我开发了一个Python Kafka生成器，它将多个json记录作为nd-json二进制字符串发送到Kafka主题。然后我试着用PySpark阅读Spark Structured中的这些消息，如下所示： events_df = select(from_json(col("value").cast("string"), schema).alias("value")) 但此代码仅适用于单个json文档。如果该值包含多个记录作为换行符分隔的json，则Spark无法正确解码它。我不想为每个单独的事件发送kafka消息。我如何才能做到这一点？

浏览 61提问于2021-02-02得票数 0

回答已采纳

1回答

kafka连接文件脉冲将JSON文件读入kafka

apache-kafka、apache-kafka-connect

我正在尝试将json文件加载到kafka，并希望使用file-pulse connector。我的json文件如下所示： { "field1": "string1", "field2": "string2", "field3": 9.8, "lastField": "2020-09-03T18:00:00" } 问题连接器的属性文件的读取器类应该是什么？我在下面 # File types fs.scan.filters=io.streamthough

浏览 11提问于2020-09-17得票数 0

1回答

使用JSON字段值作为卡夫卡主题的记录键

json、apache-kafka、elastic-stack、filebeat、elastic-beats

我在文件中有一个事件(JSON消息)，需要通过filebeat发送给Kafka。JSON消息如下所示： {"time":1582213700.001,"interval":"2s","worker":11,"application":"1.1.1.1"} 我想把这个信息发给卡夫卡。partion键应该是JSON事件消息中的应用程序字段。如何为Kafka记录提供JSON消息中的自定义应用程序字段作为partion键？像这样的filebeat.yml： … output.kafka:

浏览 0提问于2020-02-20得票数 0

1回答

Confluent S3接收器连接器中的解析问题[序列化错误]

apache-kafka、jackson、confluent-platform、s3-kafka-connector

我正在使用基础kafka-connect(v5.2.1)的confluent s3接收器连接器和confluent kafka代码。最初，kafka cdc是作为MySQL (使用maxwell)编写到kafka主题中的(没有编写模式)。这个kafka连接器从上面的apache kafka集群中读取数据，并将其写入s3。 key.converter=org.apache.kafka.connect.json.JsonConverter value.converter=org.apache.kafka.connect.json.JsonConverter 我正在使用具有以下连接器配置的分布式连

浏览 40提问于2021-05-20得票数 0

1回答

结构化流如何动态解析kafka的json数据

json、apache-spark、spark-structured-streaming

我正在尝试使用结构化流从Kafka读取数据。从kafka收到的数据采用json格式。我的代码如下所示:在代码中，我使用from_json函数将json转换为dataframe以供进一步处理。 val **schema**: StructType = new StructType() .add("time", LongType) .add(id", LongType) .add("properties",new StructType() .add("$app_version", StringType)

浏览 3提问于2019-10-15得票数 4

回答已采纳

2回答

处理大量记录会给出OutOfMemoryException - Kafka REST代理。

node.js、apache-kafka、kafka-producer-api、kafka-rest

我使用汇合REST代理调用Kafka。我正在读取一个CSV文件，从所有记录中创建一个对象(大约400万条记录)，并向REST代理发送一个请求。我一直在获取一个OutOfMemory异常。确切的例外消息是： Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "kafka-producer-network-thread | producer-81" 我只有一个REST代理服务器的实例，作为一个码头容器托管。环境变量设置为： JAVA_OPTIONS=-X

浏览 0提问于2019-04-03得票数 2

回答已采纳

1回答

Clickhouse不通过复杂物化视图消费Kafka信息

apache-kafka、materialized-views、clickhouse

TLDR摘要: Clickhouse Kafka engine，物化视图不适用于复杂的select语句. 较长版本：我试图使用JSONEachRow通过它的Kafka引擎向Clickhouse发送大量JSON数据点。但是物化视图不能正确地使用流。我有一个用go编写的kafka生产者，它接收来自多个tcp流的数据，并异步写入kafka队列。因此，数据流： ->源->生产者-> Kafka -> Clickhouse(卡夫卡引擎) ->物化视图->目标表到目前为止，这一切都很有效。我第一次遇到瓶颈时，我加快了输入数据的速度(40万点/秒)，我的制

浏览 1提问于2019-01-14得票数 2

回答已采纳

2回答

从TextNode到数组的KsqlDB转换

apache-kafka、ksqldb

在ksqlDB中，有没有一种方法可以把TextNode转换成Array<VARCHAR>，这样EXPLODE就可以不出错地执行了？全新的ksqlDB，遇到了一个奇怪的问题。我在debezium -> ksqldb上运行ETLing，数据在流动，这很棒。问题是，当我使用EXPLODE函数时，它无法解析，因为我想要成为一个数组的实际上是一个TEXTNODE。这是一个来自Postgres的简化数据结构，其中data是postgres中的JSONB： { "id": "b5b55e07-15d7-4559-8319-18a67205ea4d",

浏览 26提问于2020-12-18得票数 0

回答已采纳

1回答

在Kafka生产者中如何从外部API中读取数据并在Scala中发送给Kafka消费者

scala、apache-kafka、kafka-consumer-api、producer-consumer

我是Apache的新手，我想从 API中读取生产者内部的数据，然后将其发送到主题中，并从用户内部读取这些数据，以便将其保存到数据库中。我无法理解如何以JSON格式发送这些数据。我试过一个使用字符串值的Kafka消费者生产者的例子：在我的例子中，我的Producer.scala是： import java.util.Properties import org.apache.http.client.methods.HttpGet import org.apache.http.impl.client.HttpClientBuilder import org.apache.http.util.

浏览 0提问于2021-01-19得票数 0

回答已采纳

1回答

我试图为每次迭代生成一个kafka主题的消息，但看起来我最终没有向消费者发送消息

python、json、apache-kafka、kafka-producer-api、confluent-platform

使用循环调用kakfa produce类时，无法将消息写入kafka topic (producer)。我对Python和Kafka非常陌生。我正在尝试编写一个python程序，将消息写入Kafka主题并生成，以便Kafka消费者可以订阅该主题以发布消息。我不确定我的程序中缺少了什么，它限制了向主题写入消息。注意:我正在读取一个JSON文件，并使用for循环准备键值。然后将其赋给一个变量，并将该变量与使用arg生成的Kafka引用为msg。附件是卡夫卡制作人程序。输入: Json_smpl.json 文件内容： { "transaction":{ "Accn

浏览 36提问于2019-01-12得票数 0

1回答

JSON解码Base64 DataStream Apache

apache-flink

需要一些建议，我已经使用scala创建了一个flink作业来消费来自Kafka的消息。但是消息是用base64编码的。我试过这段代码 val x_stream: DataStream[ObjectNode] = env .addSource( new FlinkKafkaConsumer010[ObjectNode](parameters.get("kafka.topic.source"), new JsonNodeDeserializationSchema(), kfk_props

浏览 25提问于2021-09-30得票数 0

1回答

sbt.ResolveException:未解析依赖: org.glassfish.hk2#hk2-utils;2.22.2:未找到

scala、apache-spark、playframework、apache-kafka、sbt

我对Play framework是个新手。我试图在build.sbt中添加Spark和Kafka的库，但我得到了这个错误： of org.glassfish.hk2. and org.glassfish.hk2#hk2-locator;2.22.2: not found and javax.validation#validation- api;${javax.validation.version}: not found 每当我运行play run时，它都会下载jar文件，稍后会给出glassfish错误。我得到的错误是 Here are the codes:

浏览 0提问于2018-12-27得票数 1

1回答

分析kafka日志时Grok解析错误

logstash、logstash-grok

我的逻辑库分析失败了，我似乎搞不懂. 输入如下所示： "@timestamp" => 2017-03-30T13:03:41.899Z, "tst_field" => "test123avc", "@version" => "1", "message" => "[group-consumer-master,message-qa,8]::[OffsetMetadata[2,NO_METADATA],CommitTime 1490878047368,Expir

浏览 5提问于2017-03-30得票数 0

2回答

即使我通过writeStream()在kafka中提供了正确的json数据，writeStream()仍然在批量数据中打印空值

scala、apache-spark、apache-kafka、apache-spark-sql、spark-structured-streaming

我尝试使用模式转换json并将值打印到控制台，但是writeStream()在所有列中都打印空值，即使我给出了正确的数据。我正在给kafka topic提供数据。 {"stock":"SEE","buy":12,"sell":15,"profit":3,quantity:27,"loss":0,"gender":"M"} {"stock":"SEE","buy":12,"sell":15,"pr

浏览 3提问于2020-04-23得票数 0

1回答

支持嵌入式头吗？

spring、apache-kafka、spring-cloud、spring-cloud-stream、spring-kafka

根据这一主题： -这不是卡夫卡的头支持但是说： spring.cloud.stream.kafka.binder.headers 将由绑定程序传输的自定义标头列表。默认值:空。 I无法让它与弹簧云流绑定-kafka:1.2.0 发送日志： MESSAGE (e23885fd-ffd9-42dc-ebe3-5a78467fee1f) SENT : GenericMessage [payload=..., headers={ content-type=application/json, correlationId=51dd90b1-76e6-4b8d-b667-da

浏览 3提问于2017-06-15得票数 3

回答已采纳

1回答

KAFKA连接XML源和JSON接收器

json、xml、apache-kafka、apache-kafka-connect

在KAFKA中是否有一种方法可以使用XML源并将其转换为JSON并将JSON数据发送给KAFKA接收？我见过Avro，Protobuf作为卡夫卡连接的转换器？它们是否能够将XML转换为JSON？或者他们会转换为AVRO，Protobuf特定的格式，而不是JSON？

浏览 6提问于2022-03-30得票数 0

1回答

如何解析pyspark的DataStreamReader中的json字符串列并创建数据帧

pyspark、pyspark-sql、spark-structured-streaming、spark-streaming-kafka

我正在阅读来自kafka主题的消息 messageDFRaw = spark.readStream\ .format("kafka")\ .option("kafka.bootstrap.servers", "localhost:9092")\ .option("subscribe", "test-message")\ .load() messageDF

浏览 9提问于2019-02-15得票数 0

回答已采纳

1回答

数组中的有效载荷是字符串，需要强制使用数组类型(DataWeave)。

mule、dataweave、mulesoft、mule4

我从debezium/kafka接收到的有效载荷为"reasons": "[7,10,9]"，数组作为字符串。当项目为10或11时，我需要过滤数组来提取。由于数组实际上是有效负载中的字符串，所以我需要强制将它强制到数组中进行筛选。这是我目前的解决办法，但我觉得必须有一个更有效的办法： %dw 2.0 output application/json var data = payload.payload.after var reasons = data.reasons replace "[" with "" replace

浏览 5提问于2022-08-29得票数 -1

回答已采纳

1回答

无法在Spark结构化流中转换Kafka Json数据

apache-spark、pyspark、apache-kafka、apache-spark-sql、spark-structured-streaming

我正在尝试获得Kafka消息，并在独立的Spark处理它。Kafka将数据存储为json格式。我可以获取Kafka消息，但无法使用定义模式解析json数据。当我运行bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic my_kafka_topic --from-beginning命令查看kafka主题中的kafka消息时，输出如下： "{\"timestamp\":1553792312117,\"values\":[{\"id\":\"Si

浏览 24提问于2019-03-26得票数 2

回答已采纳

1回答

带有转义双引号的Logstash输入

json、apache-kafka、logstash

我试图将json字符串发送到logstash，然后再发送kafka，但是由于json文件中转义的双引号，我一直在经历json解析失败。我试过一堆不同的替换组合，但都不起作用。我不确定是否错误已经发生在配置的输入端，所以它不会继续到过滤器部分我只是没有正确地替换字符串我收到了一封信，因为： {"message": "This is a \"string with quote"} 我的储物箱是： input { tcp { codec => json { charset => "UTF-8" }

浏览 2提问于2017-10-20得票数 1

回答已采纳

1回答

从数组到Kafka主题的值

mongodb、apache-kafka、apache-kafka-connect

我使用Kafka Connect和Mongo作为源码。在我的例子中，我需要在一行中发送给消费者数据。例如，我有这样的集合： { "_id" : "sdasd", "client_id" : "11", "device_id" : "11aa11", "contacts" : [ { "contact_id" : "1", "contact_name

浏览 0提问于2021-05-31得票数 0

1回答

如何使用Spark流和Python使用Kafka的JSON记录？

python、apache-spark、apache-kafka、spark-streaming

我创建了一个带有JSON格式记录的Kafka主题。我可以使用kafka-console-consumer.sh使用这些JSON字符串 ./kafka-console-consumer.sh --new-consumer \ --topic test \ --from-beginning \ --bootstrap-server host:9092 \ --consumer.config /root/client.properties 我如何使用Python中的Spark流来实现这一点？

浏览 5提问于2017-05-24得票数 1

回答已采纳

1回答

意外输入结束:在使用Kafka主题的消息时，对象的预期结束标记

json、kotlin、apache-kafka、micronaut

我正在尝试使用来自kafka主题的消息，其中json的内容没有序列化。这个主题是用实际的JSON生成的，没有序列化，如下所示。杰森： { "guests": [ { "guest_ref_id": "000000012331202", "ids": { "profile_ids": [ "1234" ] } } ], "case_id": "500g00000

浏览 13提问于2022-08-08得票数 0

2回答

kafka FileStreamSourceConnector用键字段将avro文件写入主题

apache-kafka、avro、apache-kafka-connect

我想使用kafka FileStreamSourceConnector将本地的avro文件写成一个主题。我的连接器配置如下所示： curl -i -X PUT -H "Content-Type:application/json" http://localhost:8083/connectors/file_source_connector/config \ -d '{ "connector.class": "org.apache.kafka.connect.file.FileStreamSourc

浏览 5提问于2021-03-26得票数 2

2回答

只捕捉到的有效载荷的CDC在火花结构化的流？

sql-server、apache-spark、pyspark、apache-kafka、cdc

为了捕捉Server中的数据更改，我尝试执行从Server到Pyspark的管道，我已经准备好了一切：在Server中启用CDC 从SQL Server到Kafka进行生产，并使用Pyspark结构化流中的Kafka主题。问题是:当我试图用控制台使用者检查数据更改是否经过Kafka时，它会向我显示JSON格式的消息，分为两个记录: Schema和Payload，以及Payload内部，在此之前和之后，分别给出更改之前的数据和更改后的数据。我只在有效负载中被处理->在这部分JSON消息之后因为当我像这样流它时，在木星命令行中，在我需要的字段上显示n

浏览 0提问于2021-06-30得票数 0

回答已采纳

1回答

从writeStream读取到json文件，但在HDFS json文件中只找到一条消息。

json、apache-kafka、spark-structured-streaming

只需设置一个hadoop/kafka/星火，一个节点演示环境。在pyspark中，我尝试读取(.readStream) Kafka消息，并在hadoop中将它写入(.writeStream)到json文件。奇怪的是，在hadoop "output/test“目录下，我可以找到一个创建的json文件，但只有一个消息。卡夫卡的所有新消息都不会更新json文件。但是我想把卡夫卡的所有信息都存储在一个json文件中。我尝试过控制台(writeStream.format(“控制台”)或kafak(writeStream.format("kafka"))的接收器类型，它正常工作。

浏览 2提问于2022-08-27得票数 0

1回答

JSON列作为kafka producer中的键

python、apache-kafka、kafka-producer-api、confluent-platform

正如我们所知道的，我们可以向kafka producer发送一个密钥，该密钥在内部进行了哈希处理，以找到主题数据中的哪个分区。我有一个生产者，在那里我发送一个JSON格式的数据。 kafka-console-producer --broker-list 127.0.0.1:9092 --topic USERPROFILE << EOF {"user_id" : 100, "firstname":"Punit","lastname":"Gupta", "countrycode":

浏览 23提问于2019-12-16得票数 2

回答已采纳

1回答

从RabbitMQ队列读取时出现Kafka连接问题

apache-kafka、rabbitmq、apache-kafka-connect、confluent-platform

我正在尝试使用Kafka连接器从RabbitMQ队列中读取数据到我的主题中，配置如下： { "name" : "RabbitMQSourceConnector1", "config" : { "connector.class" : "io.confluent.connect.rabbitmq.RabbitMQSourceConnector", "tasks.max" : "1", "kafka.topic" : "rabbitmqte

浏览 17提问于2019-11-27得票数 2

回答已采纳

1回答

Kafka流不起作用:小组协调员不断被发现，不可用/无效

java、apache-kafka、apache-kafka-streams

最近，我们的(Kafka 1.1.1)经纪人倒闭了，我们的Kafka流应用程序也停止了工作。因此，我们手动停止应用程序以停止警报。卡夫卡再次上线后，我们启动了流应用程序，但它没有读取来自主题的任何消息。在阅读了日志之后，我们发现了组协调员不断发现的日志，然后在一个无穷无尽的循环中再次变得不可用。下面的是日志. [Consumer clientId=dummy-consumer-id-6b3ad573-5b6a-4e89-82c1-1705e3662d55-StreamThread-10-consumer, groupId=dummy-consumer-id] Group coordinat

浏览 0提问于2020-05-13得票数 1

1回答

找不到数据源: kafka (Docker环境)

docker、apache-spark、pyspark、apache-kafka

我们现在正面对这个问题，所有展示的“类似问题”都无助于解决我们的问题。我们对docker和spark都是新手。我们使用以下Docker Compose来设置容器： networks: spark_net: volumes: shared-workspace: name: "hadoop-distributed-file-system" driver: local services: jupyterlab: image: jupyterlab container_name: jupyterlab ports:

浏览 112提问于2020-11-11得票数 1

1回答

MessageConversionException卡夫卡消费者

java、apache-kafka、spring-cloud-stream-binder-kafka

我有下面的kafka流的配置 spring: cloud: stream: function: definition: handleCatalogEvent bindings: handleCatalogEvent-in-0: content-type: application/json destination: catalog_change group: back-group consumer: configuration

浏览 5提问于2022-11-15得票数 0

1回答

我如何接收卡夫卡的数据子集？

python、pyspark、apache-kafka、kafka-consumer-api

我知道我们可以过滤我们的消费者/流媒体节目中的数据。但我在这里寻找的是一个解决方案，过滤来自Kafka broker本身的数据。问题陈述：我有一个用例来获取卡夫卡中存在的全部数据内容以及该数据的一个子集。因此，当我创建一个使用者时，我需要传递一个过滤器查询，以便只接收过滤过的数据。我已经尝试使用Python消费者和Py火花流程序来实现它。但我没能做到。我在下面分享了我尝试过的代码片段。 Python程序 from kafka import KafkaConsumer from json import loads from time import sleep consumer = Kafk

浏览 1提问于2022-05-18得票数 0

2回答

如何在pyspark中从kafka中以字符串格式从Confluent Schema Registry获取Avro数据？

apache-spark、apache-kafka、avro、spark-structured-streaming、confluent-schema-registry

我正在从spark (结构化数据流)中读取Kafka中的数据，但在spark中从kafka中获取的数据不是字符串格式。火花: 2.3.4 Kafka数据格式： {"Patient_ID":316,"Name":"Richa","MobileNo":{"long":7049123177},"BDate":{"int":740},"Gender":"female"} 下面是kafka触发结构化流媒体的代码： # spark-submit --jars k

浏览 1提问于2019-12-27得票数 0

1回答

将字符串数组转换为节点红色中的字节数组

node.js、node-red

我有一个node-red流，它从MQTT中提取数据并将数据发布到Kafka主题。目前，我的MQTT发布程序以编码的msg pack格式发布数据。对于MQTT订阅者，默认将payload转换为String Array，如下所示。 [148,147,2,205,3,102,101,205,103,151,205,103,151,146,207,0,0,2,97,44,233,203,23,145,146,2,202,62,164,20,119,0] 有没有办法将以下字符串数组反序列化为字节数组并发布到Kafka topic？

浏览 22提问于2018-01-25得票数 1

3回答

关于访问Tuple2中的字段时出错的

scala、tuples、apache-kafka、spark-streaming

我正在尝试访问Tuple2中的一个字段，编译器正在返回一个错误。该软件试图在kafka主题中推送一个案例类，然后我希望使用火花流恢复它，这样我就可以提供机器学习算法，并将结果保存在mongo实例中。解决了！我终于解决了我的问题，我要发布最后的解决方案：这是github项目： https://github.com/alonsoir/awesome-recommendation-engine/tree/develop build.sbt name := "my-recommendation-spark-engine" version := "1.0-SNAPSHOT

浏览 2提问于2016-05-18得票数 4

回答已采纳

1回答

在输入'CREATE TABLE‘没有可行的替代方案

docker-compose、debezium

我不能使用以下命令添加MySQL连接器： curl -i -X POST -H "Accept:application/json" -H "Content-Type:application/json" localhost:8083/connectors/ -d '{ "name": "useraccount-connector", "config": { "connector.class": "io.debezium.connector.mysql.MySqlConnector

浏览 56提问于2020-10-15得票数 2

2回答

在spark结构化流中写入来自kafka / json数据源的损坏数据

apache-spark、apache-spark-sql、spark-structured-streaming

在spark批处理作业中，我通常会将JSON数据源写入到一个文件中，并且可以使用DataFrame阅读器的损坏列功能将损坏的数据写出到不同的位置，并使用另一个阅读器从同一作业中写入有效数据。(数据写为拼接) 但在Spark Structred Streaming中，我首先通过kafka将流作为字符串读取，然后使用from_json获取我的DataFrame。然后，from_json使用JsonToStructs，它在解析器中使用FailFast模式，并且不将未解析的字符串返回到DataFrame中的列。(参见参考文献中的注释)那么我如何使用SSS将与我的模式不匹配的损坏数据和可能无效的JSO

浏览 34提问于2018-12-27得票数 1

回答已采纳

1回答

如何用kafka标头编写拼花文件

java、apache-spark、apache-kafka、parquet

这是我的第一个星火项目。我想用卡夫卡的信息。这些消息包含字节arr、一些kafka头和键。所需的输出是带有列(kafkaKey、kafkaHeader1、kafkaHeader2、byteArr)的拼图文件。我试着用Spark实现它--知道我是如何添加模式的，模式正确吗？目前我无法控制输出结果是什么样子？ ... SparkSession spark = SparkSession .builder() .appName("Spark Kafka") .master("loc

浏览 11提问于2022-06-22得票数 0

1回答

ClickHouse JSON解析异常:无法在前面解析输入: expected '，‘

apache-kafka、clickhouse

我试图从Kafka向ClickHouse添加JSON数据。下面是简化的JSON： { ... "sendAddress":{ "sendCommChannelTypeId":4, "sendCommChannelTypeCode":"SMS", "sendAddress":"789345345945"}, ... } 下面是在ClickHouse中创建表的步骤，使用Kafka引擎创建另一个表，创建物化视图来连接这两个表，并将CH与Kafka连接起来

浏览 9提问于2020-12-02得票数 2

回答已采纳

1回答

星火结构流scala +合流模式注册表(json模式)

scala、apache-kafka、confluent-schema-registry

我有一个火花结构化流scala作业，它从kafka读取json消息并将数据写入S3。我配置了一个合流模式注册中心，该模式使用type=object的json格式。现在，我可以从注册表中检索模式，但是我需要在包含kafka记录的dataframe上使用这个模式。 val restService = new RestService(schemaRegistryURL) val valueRestResponseSchema = restService.getLatestVersion(schemaName) // return type is io.confluent.kafka.schemare

浏览 7提问于2022-11-30得票数 0

1回答

如何以json格式将数据从rds推送到kafka队列

mysql、json、apache-kafka

我使用kafka主题从mysql数据库接收消息，我需要编写python代码将json格式的数据从mysql推送到kafka，topic.My的要求是以json格式获得输出，而不是用原始字符串。下面是用json格式将mysql表数据转储到kafka主题的python代码。代码： connection = mysql.connector.connect(host='xyz.us-east-1.rds.amazonaws.com', database='testdb',user='stdnt', password='pssw123'

浏览 7提问于2021-05-02得票数 0

1回答

logstash->kafka->logstash->elasticsearch丢弃一些日志

elasticsearch、logstash、apache-kafka

我有一个logstash->kafka->logstash->elasticsearch设置。logstash正在跟踪一个日志文件。这个日志文件是用bunyan在nodejs中附加到的，所有内容都设置为json格式/编解码器。在我看来，任何包含空数组的日志条目都不会被传递到目的地。有人知道问题出在哪里吗？kafka不是用来接收带有空列表的json对象吗？logstash的kafka输出插件是非常新的，与此相关的已知问题吗?我无法从我的google搜索中找到任何东西。

浏览 0提问于2015-09-16得票数 0

1回答

卡夫卡JDBCSinkConnector模式异常:带有schemas.enable的JsonConverter需要“模式”和“有效载荷”

postgresql、jdbc、apache-kafka、apache-kafka-connect

我试图使用JDBCSinkConnector将数据从Kafka主题传递到Postgres。在所有操作之后，例如创建主题、创建流、创建具有配置的接收器连接器以及通过python生成数据到主题，连接日志将返回以下结果： Caused by: org.apache.kafka.connect.errors.DataException: JsonConverter with schemas.enable requires "schema" and "payload" fields and may not contain additional fields. If you

浏览 0提问于2021-04-01得票数 0

回答已采纳

1回答

如何将流json数据作为关键值对发送给kafka消费者

java、apache-kafka、kafka-producer-api

我编写了一个jave代码，从本地文件系统读取json数据，我希望将该数据作为键值对的 public static void main(String[] args) throws IOException { Stream<String> objec = Files.lines(Paths.get("path\\data.json")); String topicName="test"; Properties props=new Properties();

浏览 0提问于2018-11-30得票数 1

1回答

用于将JSON数组转换为json对象的kafka流

json、apache-kafka、apache-kafka-streams

我在普通java中有一个代码，用于将JSON数组转换为JSON对象，我需要将这个普通java转换为kafka，streams...below是我的 import java.io.*; import java.util.*; import java.lang.*; import org.json.simple.JSONArray; import org.json.simple.JSONObject; import org.json.simple.parser.JSONParser; import org.json.simple.parser.ParseException; public clas

浏览 5提问于2017-12-15得票数 0

回答已采纳

2回答

如何从kafka tapic中为ksqldb创建主题

apache-kafka、confluent-platform、ksqldb、debezium

我使用Mysql数据库。假设我有一张定单的桌子。并在Kafka中使用debezium mysql connect，创建了订单主题。但是我很难在ksqldb中创建一个流。 CREATE STREAM orders WITH ( kafka_topic = 'myserver.mydatabase.orders', value_format = 'avro' ); 我的停靠撰写文件如下所示 zookeeper: image: confluentinc/cp-zookeeper:latest container_name: zook

浏览 5提问于2021-06-27得票数 1

回答已采纳

2回答

如何从python客户端向kafka发送JSON对象

python、json、apache-kafka、kafka-python

我有一个简单的JSON对象，如下所示 d = { 'tag ': 'blah', 'name' : 'sam', 'score': {'row1': 100, 'row2': 200 } } 下面是我向Kafka发送消息的python代码 from kafka import SimpleProducer, KafkaClient import json # To send messages synchronously kafka = Kaf

浏览 0提问于2015-08-05得票数 4

回答已采纳

2回答

Kafka connect正在发送一个畸形的json

apache-kafka、apache-kafka-connect

我试图用卡夫卡-连接一个rabbitMQ连接器来验证概念。基本上，我有两个简单的spring引导应用程序:一个RabbitMQ生产者和一个卡夫卡消费者。使用者无法处理来自连接器的消息，因为它正在以某种方式转换我的JSON消息；RabbitMQ发送{"transaction": "PAYMENT", "amount": "$125.0"}和kafka-connect打印X{"transaction": "PAYMENT", "amount": "$125.0"}。请注意

浏览 0提问于2020-01-07得票数 1

回答已采纳

2回答

使用PySpark流反序列化Kafka json消息

python、json、apache-spark、deserialization、spark-streaming-kafka

我有一个pyspark应用程序，它使用来自Kafka主题的消息，这些消息由org.apache.kafka.connect.json.JsonConverter序列化。我使用confluent Kafka JDBC连接器来做这件事问题是，当我使用消息时，ID列以某种编码文本形式出现，例如"ARM=“，而它应该是数字类型。下面是我现在拥有的代码 spark = SparkSession.builder.appName("my app").getOrCreate() sc = spark.sparkContext sc.setLogLevel('WARN

浏览 20提问于2019-03-09得票数 1

回答已采纳

1回答

高效过滤来自kafka消费者的Json消息

java、json

我正在从Kafka流中读取Json对象的日志。以下是每条消息的格式： {"class": "abc.cdf", "object":{....}} 我感兴趣的是一种特殊的“类”消息，它只占收到的总消息的10%。如何根据这个字段有效地过滤出消息，而不需要为每条新消息解析整个json？目前我正在使用ByteArraySerializer和ObjectMapper来解析到json pojo，然后专门验证“类”字段。从Kafka读取的每一批消息的示例代码如下： ObjectMapper mapper = new ObjectMapper(); for

浏览 43提问于2020-07-10得票数 0