前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >回顾R和微软过去的一年

回顾R和微软过去的一年

作者头像
小莹莹
发布2018-04-23 14:23:13
9090
发布2018-04-23 14:23:13
举报

托马斯·斯莫尔的ML / DL博客最近回顾了数据科学,机器学习和深度学习显著的进步-其中许多涉及R和/或微软。以下是他们的亮点:

R Project

R和Python保持其作为开放数据科学主要工具的领导地位。Python与R的争论仍在继续,一个新的共识是数据科学家应该考虑学习两者。R有一个更强大的统计和机器学习技术库,在使用小数据时更加灵活。Python更适合开发应用程序,而Python开源许可证对商业应用程序开发的限制较少。

  • R用户社区在2016年继续扩大。在2016年O'Reilly数据科学薪资调查中,它排名第二,仅次于SQL;首先在 KDNuggets 投票; 并首先在 Rexer 调查。R在IEEE Spectrum排名中排名第五。
  • R的功能快速增长。今年四月,微软Andrie de Vries报道, CRAN(R里主要贡献包的库)里有超过8000个包。截至12月中旬,有9737个包。CRAN的机器学习包在数量和功能上继续增长。
  • R联盟,Linux基金会的一个合作项目,在2016年取得了一些进展。IBM和ESRI加入该联盟,其成员目前也包括 Alteryx,Avant,DataCamp,Google,Ketchum Trading,Mango Solutions,微软,甲骨文,RStudio,和TIBCO。现在有三个工作组和八个资助项目。
  • Hadley Wickham有一个好年景。作为R项目的最大贡献者之一,Wickham共同撰写了数据科学相关的R,并于9月发布了tidyverse 1.0.0。在优秀工具的宣言中,Wickham解释了一个好的API的四个基本原则。
  • Max Kuhn,应用预测建模的作者和插入符包学习机的开发,11月加入RStudio。RStudio此前聘请了Joseph Rickert,且他就此离开了微软。
  • AT&T实验室正在与R做一些令人印象深刻的工作,包括使用Hadoop和其他数据平台进行外部处理的分布式后端的开发。在UseR!发布会上Simon Urbanek 提出了一个总结。
  • 枚举今年在R中进行的所有有趣的分析是不可能的。David Robinson’s对Donald Trump’s的推文的分析让人产生了共鸣; 使用tidyverse,tidytext和TWITTER,Robinson能够在同一帐户中区分候选人的“声音”和他的员工的“声音”。
  • 在Revolutions博客,微软的David Smith调查了女性在R社区的增长规律。

微软

微软在机器学习和深度学习方面有一年了。正如我在第一部分和第二部分所指出的,2016年MSFT在Azure中推出了用于视觉,报告,语言,知识和搜索的认知API; AzureHDInsight中的Spark的管理服务;增强了Azure机器学习和2.0版本的深度学习框架,更名为MicrosoftCognitive Toolkit。

这只是为初学者提供的。

  • 在一月份,微软宣布推出微软R服务器,并在2015年收购了革命分析产品。微软R服务器包括一个增强R分布,可扩展的后端,和集成工具。在这一年里,微软为R Server发布了两个主要版本。在第8版中,公司加入了Spark的下推式集成。第9版更新了Spark 2.0的Spark集成,并添加了MicrosoftML,一个用于机器学习的新R包。
  • 微软在3月份发布了SQL Server 2016嵌入式SQL Server服务。在“Revolution”博客上,David Smith报告了此发布。 TomažKaštrun解释了在SQL Server你可以用R做什么。
  • 十一月,在扩展预览之后,Microsoft宣布了Azure HDInsight的R Server的普遍可用性,这是一个与从HDInsight创建的Spark集群集成的R的横向扩展实现。
  • 此外,在Azure中,微软添加一个Linux版本的数据科学虚拟机(DSVM)。以前可用作Windows实例,DSVM包括Revolution R Open,Anaconda,Visual Studio社区版,PowerBI桌面,SQL Server Express和在Azure SDK。
  • PowerBI是微软强大的可视化工具,在8月增加了R支持。在计算机世界里,R用户Sharon Machlis先生热情地说。更多详细内容在Revolution博客。
  • Visual Studio的R Tools于3月推出公开预览,9月份推出。另外在9月,微软发布了Microsoft R Client,这是一个免费的数据科学工具,与Microsoft R Open和ScaleR分布式后端一起使用。
  • 微软数据科学家Gopi Krishna Kumar,Hang Zhang和Jacob Spoelstra开发了一种数据科学方法,他们在9月的微软机器学习和数据科学峰会上提出了这种方法。David Smith对此进行了报导。该方法(作者称为团队数据科学过程)包括一个标准目录结构,用于使用诸如Git之类的系统管理项目工件。它还包括支持该过程的开源实用程序。
  • 微软团队开发了一个识别对话语音的系统,就像人类的行为一样。该团队使用用Microsoft认知工具包(CNTK)构建的卷积和长期短期记忆(LSTM)神经网络。
  • 作为CNTK发布于2015年,Microsoft将其深度学习框架重新命名为Microsoft Cognitive Toolkit(MCT)并发布了2.0版本,并提供了新的Python API和许多其他增强功能。在VentureBeat,Jordan Novet报道。
  • 该公司还在Azure中推出了22种认知API,用于视觉,报告,语言,知识和搜索。另外,MSFT在Azure HDInsight发布了针对Spark的托管服务,并继续增强Azure机器学习。
  • MSFT十二月宣布Azure N系列计算实例由普遍可用的NVIDIA图形处理器供电。

PPV课小组翻译,未经许可严禁转载。

原文:https://www.r-bloggers.com/a-look-back-at-the-year-in-r-and-microsoft/

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-02-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档