前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >助人就是助己:IBM宣布大规模资助开源大数据项目Spark

助人就是助己:IBM宣布大规模资助开源大数据项目Spark

作者头像
我是攻城师
发布2018-05-11 18:01:14
6420
发布2018-05-11 18:01:14
举报
文章被收录于专栏:我是攻城师我是攻城师

本周一,IBM宣布将对开源实时大数据分析项目Apache Spark进行大规模资助,蓝色巨人宣称,其资助的力度之大相当于每年数亿美元的投入。

Hadoop技术出自Google、Yahoo这些互联网公司,主要是为了对规模庞大的各类数据进行处理和分析。不过近年来随着大数据应用的流行,越来越多的公司也希望自己具备类似的能力,这使得Hadoop逐步进入了主流。Hadoop以及相关的分发企业如Cloudera, Hortonworks等也成为了大数据领域的投资热点。

Spark同样也提供大数据处理与分析能力。如果说Hadoop胜在规模的话,那么Spark就胜在速度。这项由2年前UC Berkeley AMP实验室开发的技术将中间输出结果保存在内存而不是分布式文件系统中,从而可以提供实时的数据分析能力。与Hadoop获得的资助相比,对Spark的支持还很不够。

正是在此背景下IBM宣布了对Spark的大规模资助。蓝色巨人将投入超过3500名开发者到Spark相关项目,为项目提供机器学习技术,并将Spark嵌入到IBM的数据分析和商用软件中,同时还会把Spark作为服务在它的Bluemix开发平台上提供出来。为了鼓励基于Spark的创新,IBM还将在旧金山设立一个Spark技术中心。IBM还将把自己的一个研究项目SystemML开源。这个项目是利用机器学习技术去识别数据模式,而它正是在Spark基础上开发的。

IBM还计划与UC Berkeley的AMPLab、DataCamp、Galvanize以及Big Data University等学术及教育组织合作提供Spark教育课程,目标是培养100万名数据工程师和数据科学家。

IBM的大规模资助令人瞩目。回顾过去,正是由于IBM的出手才让若干关键技术得到了普及,比如说1980年代IBM对PC的投入,2000年代对Linux的投入均加速了相关技术成为主流的进程。

当然,对于IBM来说,对Spark的大规模投入实际上也在帮助它自己。此举不仅能强化自己在大数据领域的地位,同时也能吸引更多开发者加盟它的生态体系,帮助IBM更快更好地解决其业务问题。

而放眼更大的环境,开源化已成不可逆转的趋势。技术巨头比以往任何时候都更加热情地涌入到这一潮流当中。比方说Google开源了自己最大的秘密之一,Facebook更是几乎将自己变成了一所开源实验室。因为这些巨头明白,如果不拥抱开源,也许就会被开源消灭。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-06-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我是攻城师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档