在启动Spring数据流流时,由于与Kafka相关的各种错误,应用程序常常无法在我的机器上部署。但我也看到了这个:kafka.admin.AdminOperationException: replication factor: 1 larger than available brokers: 0
在这两种情况下,卡夫卡进程都在运行(以及ZooKeeper),因此我假设存在某种超时阈值。有什么办法可以影响卡夫卡客户放弃并假定经纪人离开的时间吗?
我附加了一个基本的模式:我有一些传感器连接到raspberry pi 3,我想可以用mqqt代理来处理这个链接,比如蚊子。但是,我想收集关于覆盆子的数据,做一些事情,并将它们转发到一组商品硬件中,以执行与Spark或Storm的实时推理(对于哪一种?)然后,这些数据必须存储在NoSql db (可能是Cassandra或HBase )中,供Hadoop集群访问,以执行批处理推理、对它们进行语义数据丰富并在同一db上重新存储。因此,客户端可以查询系统提取有用的信息。
我应该在红砖上使用哪种技术?我的