R的数据分析制霸以及企业级应用盘点

【编者按】随着大数据被更多的企业采用,大数据分析算法编写和生产语言也得到了广泛的关注。而在不知不觉中,开源统计语言R已基本成为大数据科学家和开发者的必备技能。在所有编程语言和技巧中,人气急剧上升。

以下为译文:

通过与大数据工具整合,R提供了大数据集的深度统计能力,包括统计分析以及数据驱动的可视化等。而在金融、药物、媒体及销售这些可直接从数据中获取决策的行业中,R更得到了深度应用。

根据Rexer Analytics 2013年对数据挖掘专业人员的调查显示,R已经成为当下最流行的统计分析工具,至少有70%被调查者表示有使用过R语言。而在企业市场,R的受欢迎程度同样如此,多个公司和项目都使用R,并将其提供给大数据科学家和业务用户,其中包括了微软的云计算Azure Machine Learning、IBM的Big R、Teradata Aster R、Oracle R Enterprise、PivotalR的Big Data R发行版、SAP的R for HANA等,下面做简要分析:

搭载了R的Azure Machine Learning。微软在Azure ML中提供了R语言的API和模板,支持了300多个使用R语言的包,同时用户不用从头做起,Azure ML允许开发者使用已有的部分来组装适合自己需求的模型。这样做无疑降低了机器学习的使用门槛,让各种背景的数据科学家都可以使用。

IBM InfoSphere BigInsights Big R。Big R是一组功能库,提供了终端到终端的R与InfoSphere BigInsights集成。Big R可以被用于InfoSphere BigInsights服务器上的数据综合分析,降低亲自编写MapReduce作业的复杂性,让用户回归常见的R语法和范例。

Teradata Aster R。Teradata Aster R,通过放宽内存和处理能力限制条件,扩展开源R语言分析能力。针对R语言分析师,Aster R开发出他们熟悉的R语言和工具,并提供强大的处理能力及丰富的分析方法,其主要分为3个组件:“Aster R Library”预置100余种R语言功能;“Aster R Parallel Constructor”拥有超过5500个R语言分析工具包;“Aster SNAP Framework集成”将开源R语言引擎完全整合至Teradata Aster无缝网络分析处理框架。

Oracle R Enterprise。Oracle R Enterprise主要提供了该公司RDBMS以及Exadata设备的in-database分析能力。

PivotalR。PivotalR是一个允许R用户与Pivotal (Greenplum)Database以及Pivotal HD(用于大数据分析)交互的包,在类似R的界面为数据科学家提供in-database和in-Hadoop计算。HAWQ是Pivotal HD Hadoop技术的核心,通过支持R语言,提供了Dynamic Pipelining、世界级的查询优化器、纵向扩展、SQL依从、交互式查询、深度分析以及常用的Hadoop格式。

SAP将R与HANA集合。SAP整合了R语言和他们的内存数据库HANA,形成一个服务于移动、分析、数据服务和云集成服务的新平台,SAP通过Rserve(与R Server的通信器)实现了这个功能。因为使用了列存储,HANA能够与R效率的交换数据,SAP通过预封装快速部署解决方案来简化用户的操作。

原文链接:http://siliconangle.com/blog/2014/07/28/big-data-needs-drive-r-as-a-powerful-enterprise-ready-language/

原文发布于微信公众号 - CSDN技术头条(CSDN_Tech)

原文发表时间:2014-07-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT技术精选文摘

浅谈开发实时视频直播平台的技术要点

2352
来自专栏数据科学与人工智能

【ETL技能】白话数据仓库 ETL 搭建全过程

经过多年来企业信息化建设,大部分都拥有了自己的财务,OA,CRM 等软件。这些系统都有自己的独立数据库,记录着企业运行情况某个方面的数据。但是单独看这些系统的报...

5609
来自专栏非著名程序员

一文看尽 Google I/O 大会

1202
来自专栏SEO

「消息」Google推出新的弧形移动搜索结果界面

3838
来自专栏大数据技术学习

大数据的存储与备份,更离不开技术与创新

根据IDC研究报告,未来10年全球数据量将以40%多的增长速度呈直线上升趋势,2020年,全球的数据量将达到35ZB(35,000,000PB),是2010年的...

2688
来自专栏Java技术栈

面试 Java 高级后端开发,要准备哪些知识点?

由于我做了比较长时间的技术面试官,根据我的面试体会,不少同学收到面试后,什么准备也不会做,到时候就来了。

1411
来自专栏Android 开发者

想帮助用户做决定?你的APP可以这样设计!

2343
来自专栏Youngxj

什么是Go语言?

2792
来自专栏平凡文摘

理解程序员并不是一项简单的任务, 即使你当过程序员

1534
来自专栏java思维导图

八年Java架构学习经验总结:第六点尤为重要!

你有没有静下心来思考过:同样是做了x年Java开发,为什么你的技术比别人差很多?为什么别人每月28K你却只有10K?

1302

扫码关注云+社区

领取腾讯云代金券