R语言能处理大数据吗?三点建议让你更好使用R语言

R语言究竟能不能处理大数据,其实这个问题的答案取决于你怎样定义所需处理的大数据。R是一种语言,同时也是一种工具,并且是运行在电脑上的,运行的结果也受到电脑的性能影响。那么既然要处理大数据,关键在于如何提高使用R语言处理分析数据的效率。

简单说,有三点:

1)使用运行速度更快的电脑;

2)学习使用各种高效的package;

3)使用Revolution R代替原生的R程序。

第一点暂不讨论,从第二点说起吧。

1. 适合处理大数据的R package

众所周知,R语言的主要优势在于各种包,有的包可以极大的提高工作效率,个人最常用的3个包:和data.table、Rcpp(+RArmadillo)和parallel。

R里面最重要的内置数据类型就是data.frame了,data.frame本质是一个list,因为list是不要求元素的类型一致,所以data.frame可以存储不同类型的数据在不同的column中。

2. Revolution R

Revolution R是什么?Revolution Analytics是一家公司,在不久前被微软收购,这个公司在R基础上开发了Revolution R。Revolution R有什么优势呢?R本身是单线程的,为了利用多核心cpu,可以用各种并行计算包,如上面提起的parallel/snow等。但是这些都要写额外的代码,那么有没有不用修改任何代码来提高运行效率的办法呢?有,Revolution R就是一个解决方案。

3 MS R Server

上面的两点可以处理比较大的数据,但是并没有质变,不能实现可测量性,如果真的有非常大的数据,建议使用微软推出的MS R server。

关于R语言,小编也为大家准备了R语言相关的学习资料。希望在大数据R语言方向发展并感兴趣的同学可以私信小编获取资料。

本文来自企鹅号 - 科技大咖汇媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云传输

什么是企业的数据传输能力?

对于C端用户来说,越来越无需操心数据下载的问题,只要保证网络连接通畅,便可坐等享受更便捷的在线服务。数据传输的压力转移到了服务提供商一侧,由他们操心如何第一时间...

24070
来自专栏FreeBuf

高效IT灾难恢复计划应该涵盖的7大要素

飓风、龙卷风、地震、火灾、洪水、恐怖袭击以及网络攻击,您要知道所有这些问题都可能会随时发生在您的公司。您可能也已经制定了灾难恢复(DR)计划,来保护企业的数据、...

15730
来自专栏云计算D1net

混合云存储的企业指南

24270
来自专栏区块链

用户规避安全措施的5种方式 如何正确防范?

【IT168 评论】如果组织在工作安全方面限制过多的话,工作人员通常选择便利性而不是安全性。但是组织可以采取一些步骤将安全平衡扭转回来。 作为一名网络安全专家,...

19470
来自专栏IT大咖说

数据库从业者必看:图数据库能否引领潮流?

内容来源:2018 年 10 月 20 日,腾讯云数据库专家产品经理邵宗文在“ODF走进名企之贝壳技术沙龙-数据库存储技术的多元应用”进行《图数据库及应用场景》...

15430
来自专栏云计算D1net

避免云中断和提高系统性能的4种方法

当大多数人听到关于云计算中断的头条新闻时,他们通常考虑的是哪个云计算供应商,或其负面宣传将如何影响股票价格,却很少有人会想到事件背后的相关人员,也就是负责修复问...

16420
来自专栏云计算D1net

VMware的云计算野心

虚拟化专业厂商VMware希望成为全球“云服务最大的提供商”之一,而避免与目前的IaaS市场领导者Amazon Web Services(AWS)直接竞争。...

34330
来自专栏程序员互动联盟

开发同事辞职,接手到垃圾代码怎么办?

辞职的人留下一堆写的比较烂的代码,这种事情在十几年的编程生涯中遇到了好几次。即使代码再烂在没有预留充足的时间情况下,也不会轻易的改动,在有限的时间内先把能处理的...

15520
来自专栏企鹅号快讯

物联网安全领域的“研究点”与“切入点”

物联网漏洞挖掘主要关注两个方面,一个是网络协议的漏洞挖掘,一个是嵌入式操作系统的漏洞挖掘。分别对应网络层和感知层,应用层大多采用云平台,属于云安全的范畴,可应用...

24690
来自专栏腾讯大讲堂的专栏

MUG & ACT 代理游戏运维支撑浅析

前言08年腾讯游戏的“四大名著”,同时在线均过百万,为腾讯游戏带来了丰厚的营收。其中三款为代理游戏,分别由国内及韩国开发商研发,这一点见证了代理游戏业务的多样性...

20580

扫码关注云+社区

领取腾讯云代金券