前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨

大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨

原创
作者头像
用户2292346
发布2018-07-16 16:27:59
8280
发布2018-07-16 16:27:59
举报

使用大数据分析;Spark,MapReduce和Yarn是当今最流行的三种大数据框架;机器学习继续获得更多的行业支

持和投资计划,Spark Machine Learning Library(MLib)的采用率预计在未来12个月内将增长60%。

大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨
大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨

大数据

Crowds®系列研究中的一部分。这个系列报告将大数据分析定义为最终用户能够访问、分析和管理Hadoop生态体系

中数据的一套系统,连续第三年考察与分析了大数据分析最终用户的使用趋势与使用意图。

大数据学习群:716581014

1. 使用大数据的公司比例首次超过50%

大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨
大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨

大数据分析增长趋势

目前,正在使用大数据的公司比例从2015年的17%迅速增长至53%,首次超过了50%。另外有36%的受访者表示未来

会使用大数据分析,仅仅有11%的受访者表示暂时没有使用记录(这是近三年来历史最低)。电信与金融服务公司大

数据分析服务最活跃的早期应用者,也是增速最快的行业,接下来的是科技与医疗行业,而教育行业的大数据应用者

占比最低。但是,大部分的教育公司正在评估是否使用大数据分析。

大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨
大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨

大数据分析在各个行业的使用状况

2. 数据仓库优化被认为是大数据分析最主要的使用场景

大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨
大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨

大数据分析使用场景

数据仓库优化被认为是大数据分析最主要的使用场景,70%的受访者认为数据仓库优化是重要或非常重要。客户/社交

分析与预测是排在第二位的使用场景,预测与维护排在第三位。很有趣的是,在物联网(IoT)领域,大数据分析似乎

并不是那么重要。在行业中大数据分析使用场景差别很大,在金融服务和电信行业中,数据仓库优化是主要使用场

景,欺诈检测应用比例也较高,而科技公司则主要使用大数据分析进行医疗保健和客户/社交分析。

大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨
大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨

各行业主要使用场景

3. Spark是最受欢迎的的数据框架,SparkSQL是最受欢迎的大数据访问方式

大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨
大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨

大数据框架

Spark成为最受欢迎的大数据框架,超过70%的受访者认为Spark重要或非常重要,排在二三位的是MapReduce和

Yarn。在大数据访问方式上Spark SQL、Hive、HDFS和Amazon S3最受欢迎。73%的受访者认为Spark SQL对他们

的分析策略至关重要, 而超过30%的受访者认为Hive和HDFS也很重要。 作为五大数据访问方式之一的亚马逊S3也具

有较高认可程度。

大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨
大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨

大数据访问方式

4. MLib将主导整个机器学习

机器学习继续获得更多的行业支持和投资计划,Spark 机器学习库(Spark Machine Learning Library,MLib)当前

意46%使用率排在首位。在接下来的12个月里,这一数字有望增长60%到72%。未来两年将主导整个机器学习。

大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨
大数据研究报告:Spark最受欢迎,机器学习库MLib采用率持续上涨

机器学习框架使用分布

大数据学习可以加群:716581014

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档