前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用【机器学习】来研究【机器学习】:SVM为最热门研究主题,Python超越SAS和R

用【机器学习】来研究【机器学习】:SVM为最热门研究主题,Python超越SAS和R

作者头像
数说君
发布2018-04-08 11:45:58
7530
发布2018-04-08 11:45:58
举报
文章被收录于专栏:数说工作室数说工作室

前几天BAT齐聚深圳,机器学习、人工智能成了热门话题。有人问我,机器学习这么逆天,怎么不用来学习学习“自己”(指机器学习本身)呢?

别急,今天介绍两个研究,都是分析“自己”的:

  • 一个是对招聘网站上数据分析工具出现的数量进行统计分析,得出数据分析软件的热门排名;
  • 一个是对54000篇关于机器学习的论文的摘要进行文本分析,得出机器学习领域中排名前10 的研究主题

1. Python的热度已经远超R和SAS

《R for SAS and SPSS Users》的作者Bob Muenchun,近日在他的个人网站

r4stats.com上发表了一篇文章。文中他对美国最大的招聘网站ndeed.com上某一天的数据科学职位进行了统计,得出各种软件的招聘需求量:

需求最多的是SQL,有约18000个。这个结果可以理解,SQL是做数据分析最基本的技能,即使在SAS中,proc sql也是很风靡的。

紧随其后的是Python,13000个左右。Python太强大了,爬虫、可视化、数据分析无所不能。这世界上,除了中文,还能有比Python更美丽的语言么!?嗯,没毛病~

Hadoop排第四,10000个左右。数说君自己的感觉,招聘网站上数据分析/挖掘类职位,有Hadoop(或Spark)需求的、和没有Hadoop(或Spark)需求的相比,工资提高了一个等级。

R和SAS分别排第五和第七。这是R第一次在数据科学类的职位排名中超过SAS。

注意一下倒数第三个,谷歌开发的开源人工智能学习框架tensorflow,推荐大家关注学习,据说将会比Android更加深远的影响者世界。

(原文:http://r4stats.com/2017/02/28/r-passes-sas/)

2. SVM为最热机器学习研究主题

Cornell大学的网站上最近更新了一项研究,该研究的参与者来自卢森堡、英国、美国等地的学者。研究对54000篇、发表于2007~2016年重要期刊和会议上关于机器学习的文章摘要进行了文本分析,得出机器学习领域中排名前10 的研究主题。

在文本分析的方法上,采用二元语法和三元语法作为提取策略、采用 RAKE 进行基于机器学习作为关键词提取的方法,这不是重点,重点是研究最终得出的10个研究主题:

这是个研究主题分别是:支持向量机,神经网络,数据集,目标函数,马尔科夫随机场,特征空间,生成模型,线性矩阵不等式,高斯混合模型以及主成分分析。其中前三个最火,从第四个开始流行度急剧下跌。

(原文:https://arxiv.org/abs/1703.10121)

3. 总结和资料

  • 软件工具方面,SQL是必须掌握的基础,其次Python需求最火,Hadoop/ Spark是大数据的未来,R和SAS最好会至少一个,然后关注一下Tensorflow。
  • 研究主题方面,SVM支持向量机、神经网络、数据集是最流行的研究主题。
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-04-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数说工作室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 《R for SAS and SPSS Users》的作者Bob Muenchun,近日在他的个人网站
  • r4stats.com上发表了一篇文章。文中他对美国最大的招聘网站ndeed.com上某一天的数据科学职位进行了统计,得出各种软件的招聘需求量:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档