我使用flume文件通道和avro源-宿拓扑来传输日志。在日志的同时,flume也导致了大量损坏的日志。我怎么能删除这样的日志。
由于合并了一些日志,基本上发生了损坏。假设我有10个来自机器A的日志和10个来自机器B的日志。现在发生的是Flume给了我21个日志(来自机器A和B各10个)和1个日志,这是来自机器A和B的日志的组合。但是,这并不是那么频繁。我在10000个日志中得到了大约1个损坏的日志,但由于规模的原因,这也成为了一个问题。
发布于 2014-03-26 08:22:35
您可以使用interceptor丢弃您选择的事件。也许您可以内省事件的主体,以检查损坏并丢弃它们。
https://stackoverflow.com/questions/21906548
复制相似问题