SQL Server 2016将支持R编程语言

R编程语言最早出现于1993年,而在2000年,它的第一个符合产品质量的版本R-1.0发布了。自那之后,R就成为了统计分析方面的业界标准,围绕着这门语言出现了大量的图形界面工具,以及可用于各种IDE及文本编辑器的包。

Revolution Analytics是一家成立了9年的公司,他们为R语言提供商业级的支持服务。但就在最近,微软收购了这家公司,作为他们向大数据及机器学习领域迈出的第一步。这次收购的结果是在即将问世的SQL Server 2016中将提供对R语言的支持。

SQL Server R Services的主要优点在于数据的本地化。通过在数据库中直接运行R,免除了将数据从数据库服务器搬到R服务器的过程中通常会产生的性能开销。它的另 一个优点在于能够将整个操作封装为一个存储过程,因此无需通过某个外部应用服务器对操作过程进行控制。

调用这一过程的方法是使用sp_execute_external_script,这个存储过程允许你通过标准的查询将数据从SQL Server传递至R服务。而在R脚本执行完毕之后,可以返回一个R变量,通常来说是一个数据帧。

在sp_execute_external_script中有一个令人感兴趣的特性,即@language这个参数。虽然它目前仅限于使用R语言,但从文档上看,未来似乎可以通过一种插件模型以支持其他脚本语言。

可使用任意一种通过xxx注册的受支持语言。language的类型是sysname。

在进行复杂的数据处理时,R语言比起常规的SQL语句具有许多优势。Casimir Saternos在他的文章“超越SQL:使用R语言进行数据处理”中提出了一些示例,例如如何简化表的PIVOT和UNPIVOT操作。Casimir在文章的总结中这样说道:

从定义上来说,SQL是一种查询语言。它的长处在于从数据库中获取数据,在许多场景中,这是唯一一种从数据库中取出数据的方法,因而显得至关重要。 但是,在进行数据转换时,SQL又有可能变得非常笨重。SQL本身是一种非常灵活的语言,因此也支持以大量不同的方式进行数据的转换,但这些转 换往往需要使用冗长的、晦涩的、难以维护的SQL语句。而通过R语言所带的大量的包,可以以一种简洁的、清晰的、简单的方法执行相同的操作。付出一定时间 去学习这些包是完全值得的,这让我们能够充分利用SQL与R语言包中最好的方面,通过一系列易于理解与掌握的步骤实现数据的分析。

SQL Server 2016当前的最新版本是第3个社区技术预览版。

1、回复“数据分析师”查看数据分析师系列文章

2、回复“案例”查看大数据案例系列文章

3、回复“征信”查看相关征信的系列文章

4、回复“可视化”查看可视化专题系列文章

5、回复“SPPS”查看SPSS系列文章

6、回复“答案”查看hadoop面试题题目及答案

7、回复“爱情”查看大数据与爱情的故事

8、回复“笑话”查看大数据系列笑话

9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载

PPV课大数据ID: ppvke123 (长按可复制)

本公众号专注大数据和数据科学领域,分享领域知识和相关技术文章,探索大数据商业价值,培养和挖掘大数据专业人才,欢迎大家关注!

本文分享自微信公众号 - PPV课数据科学社区(ppvke123)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-02-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

还不知道这 11 个超酷的编程新工具你就 out 了!

在这篇文章中,我们将列出你在日常工作中能够使用的新的开发工具。很多对在线流媒体感兴趣的开发人员已经开始在他们的开发环境中使用这些新工具,因为相比他们的旧的设施来...

11920
来自专栏Golang语言社区

[Go语言]采用Go语言作为服务端编程语言的建议书

按:这是我给公司(部门)写的使用推广Go语言的建议书,给领导看了以后,领导同意使用Go语言对一些服务器程序进行改写并部署到外网进行验证。希望这篇文章能够给同样在...

1.2K80
来自专栏CSDN技术头条

SQL & NoSQL之辩,究竟谁更适海量数据处理

【编者按】大数据应用程序究竟是选择SQL还是NoSQL?VoltDB公司首席技术官Ryan Betts和Couchbase公司首席执行官Bob Wiederho...

22370
来自专栏SDNLAB

对象存储的演进之路

47550
来自专栏云资讯小编的专栏

腾讯云发布无服务器云函数,较云主机成本低约70%

4月26日,腾讯云宣布,正式开放国内首款FaaS(Function as a Service,函数即服务) 产品——无服务器云函数(SCF,Serverless...

1.4K00
来自专栏程序你好

数据库设计中的6个最佳实践步骤

如果设计得当,数据库是记录、存储、检索和比较数据的强大工具。然而,一个没有经过精心设计和目的的数据库不仅仅是无效的,它对那些使用它最多的人(开发人员)来说是一个...

15920
来自专栏solarest的专栏

为您的组织机构选择正确的企业云解决方案

云计算作为一种强大的新技术,正在被越来越多的组织迁移和使用。然而向云的迁移也着实让人担心。开发复杂度、时间损耗、安全风险、噩梦般的应用迁移方案还有不成熟的私有云...

22460
来自专栏木可大大

漫谈软件开发过程

一个合理而又有效的软件开发过程对软件开发人员来说是至关重要的,决定着开发是痛苦的挣扎,还是不断进步的喜悦。目前软件开发一般过程包含以下几个步骤:理解需求、架构设...

15140
来自专栏Golang语言社区

[Go语言]采用Go语言作为服务端编程语言的建议书

按:这是我给公司(部门)写的使用推广Go语言的建议书,给领导看了以后,领导同意使用Go语言对一些服务器程序进行改写并部署到外网进行验证。希望这篇文章能够给同样在...

72170
来自专栏云计算

为您的组织选择正确的企业云解决方案

目前,云计算已被广泛使用,并且成为多数企业为之努力的目标。然而,入云所带来的现实问题也令人担忧。耗时费力的部署,安全风险,噩梦般的应用程序迁移场景以及不成熟的私...

23260

扫码关注云+社区

领取腾讯云代金券