首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >集成Kafka和HBase的最佳实践

集成Kafka和HBase的最佳实践
EN

Stack Overflow用户
提问于 2015-08-18 15:04:08
回答 2查看 4.2K关注 0票数 6

将Kafka中的流数据“导入”到HBase中的最佳实践是什么?

使用案例如下:将车辆传感器数据流式传输到Kafka。然后,必须对这些传感器数据进行转换(即,将protobuf反序列化为人类可读的数据),并将其存储在HBase中。

1)您推荐哪个工具集(如Kafka --> Flume --> HBase、Kafka --> Storm --> HBase、Kafka --> Spark Streaming --> HBase、Kafka --> HBase)

2)哪里是进行protobuf反序列化的最佳位置(例如,在Flume中使用拦截器)?

谢谢您一直鼓励我。

最好的,托马斯

EN

回答 2

Stack Overflow用户

发布于 2015-08-18 22:54:47

我认为你只需要做暴风Kafka -> -> HBase。

Storm:Storm spout将订阅Kafka topic。

然后,Storm bolts可以转换数据并将其写入HBase。

您可以使用java中的HBase客户端接口将数据从Storm写入HBase。

我之所以推荐Storm,是因为它实际上一次只处理一个元组。In Spark streaming, a micro-batch is processed。但是,如果您希望使用通用的基础设施进行批处理和流处理,那么Spark可能是一个不错的选择。

如果你最终使用Spark,那么你的流程也将是Kafka -> Spark -> HBase

票数 4
EN

Stack Overflow用户

发布于 2017-03-02 07:42:46

1)我推荐使用'Kafka连接‘接口将您的数据从Kafka流式传输到HBase。Kafka社区有几个接收器连接器:http://docs.datamountaineer.com/en/latest/hbase.html https://github.com/mravi/kafka-connect-hbase 2)至于数据转换,你可以使用Kafka Streams,这是自2016年5月Kafka 0.10发布以来包含在Kafka中的轻量级Java库:http://kafka.apache.org/documentation/streams

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32065717

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档