悦思悦读-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

悦思悦读

IT技术（人工智能，大数据）和职场话题

专栏成员

170

文章

239846

阅读量

49

订阅数

Spark Tips4: Kafka的Consumer Group及其在Spark Streaming中的“异动”(更新)

spark apache html

按照Kafka官方的说法（http://kafka.apache.org/08/introduction.html），某一特定topic对于相同group id的clients采用queuing机制，也就是说topic中的每个message只能被多个group id相同的consumer instance(process或者machine)中的一个读取一次。使用Kafka的High Level Consumer API (kafka.javaapi.consumer.ConsumerConnector 的

2018-03-15

1.2K0

Spark为什么比Hadoop快那么多？

spark hadoop 编程算法 mapreduce 存储

在2014年11月5日举行的Daytona Gray Sort 100TB Benchmark竞赛中，Databricks 用构建于206个运算节点之上的spark运算框架在23分钟内完成100TB数据的排序，一举击败了该赛事2013年的冠军—Yahoo团队建立在2100个运算节点之上的Hadoop MapReduce集群，该集群耗时72分钟排序了102.5TB的数据。换句话说，Spark用了十分之一的资源在三分之一的时间里完成了Hadoop做的事情。 HadoopSpark被排序数据大小102.5 TB

2018-03-15

2.2K0

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态