我有25-20个代理将数据发送给两个收集器代理,然后这些收集器代理必须将其写入HDFS。
这些收藏家的代理人在哪里?在Hadoop集群的数据节点上还是在集群之外?每个人的优点/缺点是什么,人们目前是如何管理它们的?
发布于 2014-03-27 03:17:56
第二层水槽代理使用hdfsSink直接写入HDFS。更重要的是,Tier1可以使用故障转移下沉组。如果二级水槽中的一种被关闭。
https://stackoverflow.com/questions/22649452
相似问题