因为我发现Azure Service Bus没有spark结构化流源,所以在这种情况下,我可以使用提供的Python客户端读取Azure Service Bus消息,然后从Python客户端读取每个消息并将其写入Kafka主题,在这个Kafka主题上,我将应用spark结构化流编程。我的用例是使用Azure Service Bus流消息,并通过将其转换为时间流数据库InfluxDb
我有一个DataSet[Row],其中每一行都是JSON字符串。我只想打印JSON流,或者对每批JSON流进行计数。到目前为止,以下是我的代码 .format("kafka")
.optionHowever when I run my Kafka consumer separately (independent ofSpark I can