前几天BAT齐聚深圳,机器学习、人工智能成了热门话题。有人问我,机器学习这么逆天,怎么不用来学习学习“自己”(指机器学习本身)呢?
别急,今天介绍两个研究,都是分析“自己”的:
1. Python的热度已经远超R和SAS
需求最多的是SQL,有约18000个。这个结果可以理解,SQL是做数据分析最基本的技能,即使在SAS中,proc sql也是很风靡的。
紧随其后的是Python,13000个左右。Python太强大了,爬虫、可视化、数据分析无所不能。这世界上,除了中文,还能有比Python更美丽的语言么!?嗯,没毛病~
Hadoop排第四,10000个左右。数说君自己的感觉,招聘网站上数据分析/挖掘类职位,有Hadoop(或Spark)需求的、和没有Hadoop(或Spark)需求的相比,工资提高了一个等级。
R和SAS分别排第五和第七。这是R第一次在数据科学类的职位排名中超过SAS。
注意一下倒数第三个,谷歌开发的开源人工智能学习框架tensorflow,推荐大家关注学习,据说将会比Android更加深远的影响者世界。
(原文:http://r4stats.com/2017/02/28/r-passes-sas/)
2. SVM为最热机器学习研究主题
Cornell大学的网站上最近更新了一项研究,该研究的参与者来自卢森堡、英国、美国等地的学者。研究对54000篇、发表于2007~2016年重要期刊和会议上关于机器学习的文章摘要进行了文本分析,得出机器学习领域中排名前10 的研究主题。
在文本分析的方法上,采用二元语法和三元语法作为提取策略、采用 RAKE 进行基于机器学习作为关键词提取的方法,这不是重点,重点是研究最终得出的10个研究主题:
这是个研究主题分别是:支持向量机,神经网络,数据集,目标函数,马尔科夫随机场,特征空间,生成模型,线性矩阵不等式,高斯混合模型以及主成分分析。其中前三个最火,从第四个开始流行度急剧下跌。
(原文:https://arxiv.org/abs/1703.10121)
3. 总结和资料