专栏首页PPV课数据科学社区SQL Server 2016将支持R编程语言

SQL Server 2016将支持R编程语言

R编程语言最早出现于1993年,而在2000年,它的第一个符合产品质量的版本R-1.0发布了。自那之后,R就成为了统计分析方面的业界标准,围绕着这门语言出现了大量的图形界面工具,以及可用于各种IDE及文本编辑器的包。

Revolution Analytics是一家成立了9年的公司,他们为R语言提供商业级的支持服务。但就在最近,微软收购了这家公司,作为他们向大数据及机器学习领域迈出的第一步。这次收购的结果是在即将问世的SQL Server 2016中将提供对R语言的支持。

SQL Server R Services的主要优点在于数据的本地化。通过在数据库中直接运行R,免除了将数据从数据库服务器搬到R服务器的过程中通常会产生的性能开销。它的另 一个优点在于能够将整个操作封装为一个存储过程,因此无需通过某个外部应用服务器对操作过程进行控制。

调用这一过程的方法是使用sp_execute_external_script,这个存储过程允许你通过标准的查询将数据从SQL Server传递至R服务。而在R脚本执行完毕之后,可以返回一个R变量,通常来说是一个数据帧。

在sp_execute_external_script中有一个令人感兴趣的特性,即@language这个参数。虽然它目前仅限于使用R语言,但从文档上看,未来似乎可以通过一种插件模型以支持其他脚本语言。

可使用任意一种通过xxx注册的受支持语言。language的类型是sysname。

在进行复杂的数据处理时,R语言比起常规的SQL语句具有许多优势。Casimir Saternos在他的文章“超越SQL:使用R语言进行数据处理”中提出了一些示例,例如如何简化表的PIVOT和UNPIVOT操作。Casimir在文章的总结中这样说道:

从定义上来说,SQL是一种查询语言。它的长处在于从数据库中获取数据,在许多场景中,这是唯一一种从数据库中取出数据的方法,因而显得至关重要。 但是,在进行数据转换时,SQL又有可能变得非常笨重。SQL本身是一种非常灵活的语言,因此也支持以大量不同的方式进行数据的转换,但这些转 换往往需要使用冗长的、晦涩的、难以维护的SQL语句。而通过R语言所带的大量的包,可以以一种简洁的、清晰的、简单的方法执行相同的操作。付出一定时间 去学习这些包是完全值得的,这让我们能够充分利用SQL与R语言包中最好的方面,通过一系列易于理解与掌握的步骤实现数据的分析。

SQL Server 2016当前的最新版本是第3个社区技术预览版。

1、回复“数据分析师”查看数据分析师系列文章

2、回复“案例”查看大数据案例系列文章

3、回复“征信”查看相关征信的系列文章

4、回复“可视化”查看可视化专题系列文章

5、回复“SPPS”查看SPSS系列文章

6、回复“答案”查看hadoop面试题题目及答案

7、回复“爱情”查看大数据与爱情的故事

8、回复“笑话”查看大数据系列笑话

9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载

PPV课大数据ID: ppvke123 (长按可复制)

本公众号专注大数据和数据科学领域,分享领域知识和相关技术文章,探索大数据商业价值,培养和挖掘大数据专业人才,欢迎大家关注!

本文分享自微信公众号 - PPV课数据科学社区(ppvke123)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-02-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大数据从上网习惯带你了解真正的“00后”

    “00后” 你以为 Chrome 很符合年轻人口味? 但他们最常用的是 IE 啊! “00后”,作为互联网新时代的小鲜肉,他们可谓是在互联网时代成长的一代新生...

    小莹莹
  • 【干货】大数据的处理及建模技术–基于R语言实现 附44页PDF下载

    未完…请下载完整版 点击底部阅读原文下载完整版PDF大数据的处理及建模技术–基于R语言实现 作者谢佳标:PPV课讲师,查看谢佳标老师的在线课程《R语言实战》 P...

    小莹莹
  • 为什么大数据如此重要?

    ? 大数据 大数据是一种现代云基础架构,它包含了多种与其他人连接和共享信息的方法。它推动了“物联网”的发展,如通过社交网站连接人、通过共享朋友或网络来寻找人们...

    小莹莹
  • 大数据24小时 | 现代汽车将首家海外数据中心地点瞄准贵州;内蒙古一大数据产业园即将落地

    数据猿导读 将机器人串联在第三方服务上,团队沟通工具BearyChat获千万元融资;中国联通与银联合作,共同开发大数据产品;互联网广告精准投放服务商“联创云科”...

    数据猿
  • 75个每个人都应该知道的大数据术语

    在第一篇文章中介绍了以下术语:算法,分析,描述性分析,规定分析,预测分析,批处理,Cassandra,云计算,集群计算,黑暗数据,数据湖,数据挖掘,数据科学家,...

    首席架构师智库
  • Mysql两千万数据优化及迁移

    最近有一张2000W条记录的数据表需要优化和迁移。2000W数据对于MySQL来说很尴尬,因为合理的创建索引速度还是挺快的,再怎么优化速度也得不到多大提升。

    用户5224393
  • R语言:用R语言填补缺失的数据

    如果缺失数据的量相对于数据集的大小非常小,那么为了不偏离分析而忽略缺少特征的少数样本可能是最好的策略,但是留下可用的数据点会剥夺某些数据的特征。

    拓端
  • 震撼可视化,4分钟看完世界5500年版图演变(视频)

    导读:人类历史进展?国家版图如何变化?5500年厚重的历史如何被压缩到4分钟内?请观看视频,感受可视化的魅力。 ? 超震撼 | 地学最前沿的16幅动图 ? ...

    小莹莹
  • 一个数据人的思考

    最近领导和团队沟通,想提高数据建模团队的能力。结合自己工作的经验和朋友的交流,来总结下如何去做。

    数据社
  • 数据迁移的几种方式 - MySQL数据库

    开始和数据库玩耍以后,我们将一直与SQL和数据打交道。在日常的操作中,我们只需要对指定的数据库进行操作,执行增删改查,权限管理等。但有些时候由于项目的升级,或...

    聚沙成塔

扫码关注云+社区

领取腾讯云代金券