本文列举了大数据相关的部分热门项目,盘点了该生态圈目前流行的一些开源产品和工具,并用google热度趋势图体现了它们的受关注程度。从不同的热度趋势,可以了解到每一个产品在近5年来全球受关注的走势,是越来越受重视还是渐渐淡出。
在QCon2016 北京站上,Druid开源项目的负责人,Imply联合创始人Fangjin Yang分享了题为 《Evolution of Open Source Data Infrastructure》的主题演讲大数据开源技术演进,探讨了开源大数据世界的发展和方向。作为引申,我们希望在此基础上,利用Google Trends的趋势分析能力对一些热门开源工具做了一一搜索、对比和排名。
因为大数据令人惊讶的高速发展以及知识局限性,本文没有(也不可能)列举出这个生态圈里的所有开源类型,比如机器学习、数据挖掘等等无法一一罗列,也无意涵盖所有大数据牵涉的各个角落,比如OpenStack、Docker等相关大热门。这里推荐了一些比较流行的开源产品,希望能引起大家兴趣和关注。在内容介绍上,因为它们大都耳熟能详,也仅仅是抛砖引玉的对每一款产品做了简单的描述,这些描述基本来自官网介绍以及各类技术网站的推介。
注意
调度与管理服务
文件系统
数据搜集
消息系统
数据处理
查询引擎
内存技术
数据存储
分析和报告工具
开发平台
机器学习
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。