专栏首页素质云笔记R︱Rstudio 1.0版本尝鲜(R notebook、下载链接、sparkR、代码时间测试profile)

R︱Rstudio 1.0版本尝鲜(R notebook、下载链接、sparkR、代码时间测试profile)

一、R notebook

1、安装问题

如果R的版本够的话,需要预装knitr,rmarkdown,同时你点击R notebook就会直接帮你加载。

但是另外一台电脑在低版本的R中,3.1好像需要加装tibble 1.0,并且尝试了还是用不来,报错:

tibble1.1 is required but 1.0 is available

会让你check that getOption("repos")看看版本对不对,不够我加载得对的tibble包,还是没用,所以不知道是不是版本问题。

2、界面

界面跟Rmarkdown差不多,查看R语言自动化报告格式——knitr

有以下几个新功能点:

为 R Markdown增添一个强大的创作引擎。在数据分析领域,R Notebooks 具有极为引人注目的优势!

(1)实时反馈结果

可以看到代码运行到哪一步以及每步的运行结果;可以实时反馈结果,如果是传统的R Markdown模式,每次修改都需要重新knit(你懂的)才能看到效果,如果遇到大规模的计算,需要等上半天。

而在R Notebooks中,你可以立即看到你执行的代码的效果。此处“效果”包括各种内容:控制台打印结果、绘制图表、数据框,甚至交互的HTML控件。

(2)兼容其他语言

R Notebooks不仅可以运行R代码,还可以运行 Python, Bash, SQLor C++ (Rcpp).直接用SQL语句,牛不牛!

(3)其他:丰富的输出格式。即时查看功能以及分享功能。

————————————————————————————————————

二、sparkR

Sparklyr 包是一个新的接口在R与Apache Spark. RStudio现在集成支持Spark和sparklyr包,主要工具如下:

1.创建和管理Spark连接

2.浏览表和Spark数据框的列

3.预览Spark数据框的前1000行

一旦安装好sparklyr包,你就可以发现Spark面板。这个面板包括一个新的连接,可以用于本地或者远程spark实例连接。

连接成功后,你可以看淡Spark集群中的数据表。

使用RStudio浏览Spark数据框中的数据。

————————————————————————————————————————————————————

三、Profiling with profvis——代码测试神器

每一步代码的耗时,有了这个无疑在写函数的时候,就能够很好地对自己的代码进行测试,提高编译效率。笔者觉得这个乃是本次更新最大亮点。

在栏目中就有这个,你可以指定行进行测试,用"profile selected Line(s)"

也可以用"start profilling " 一步一步测试,直到你的代码截止,然后点击“stop profilling”

1、分析结果解读一:代码运行步骤

在分析结果中主要有两块内容:上部,是代码本身,以及执行每一行所消耗的内存及时间;下部是一个火焰图(什么鬼),显示R在执行过程中具体干了啥,横向从左到右代表时间轴,纵向代表了调用栈也就是当前调用的函数。

分析结果还有个Data页,点开来是个调用树,展示了各个函数调用的花费情况(仍然是内存及时间)。

2、分析结果解读二:代码运行时间

分析结果还有个Data页,点开来是个调用树,展示了各个函数调用的花费情况(仍然是内存及时间)。

`a <- 1`代码可以调戏profvis

(本节内容来自公众号子豹)

————————————————————————————————————

四、数据输入——新手数据导入福音

RStudio 现在集成了readr/readxl/haven包,以提供高效的工具实现不同格式文件的导入。可以直接支持:

导入的界面很亲民,同时把调用的代码也显示出来,新手可以来这看看,免去了很多麻烦!!

1、功能点一:指定输入数据是否需要行名

于是我们指定跳过6行记录,并且不要将第一行作为列名。

但是有些字段明明是数字却被显示成了字符串,可以直接在列名的下拉框里进行修正。(来源公众号:子豹)

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 练习题︱基于今日头条开源数据(二)——两款Apriori算法实践

    在R语言里面有非常好的package,可见我之前的博客: R语言实现关联规则与推荐算法(学习笔记) 该packages能够实现以下一些可视化:

    素质
  • NVIDIA的python-GPU算法生态 ︱ RAPIDS 0.10

    随着新版本的推出,RAPIDS 迎来了其推出一周年纪念日。回顾所经历的一年,RAPIDS团队就社区对该项目的关心和支持表示衷心的感谢。此前,RAPIDS获得了其...

    素质
  • 多模态+Recorder︱多模态循环网络的图像文本互匹配

    图像文本匹配,顾名思义,就是度量一幅图像和一段文本的相似性,该技术是多个模式识别任务的核心算法。例如,在图像文本跨模态检索任务中,当给定查询文本,需要依据图像文...

    素质
  • ResNet改进版来了!可训练网络超过3000层!相同深度精度更高

    作者成功在ImageNet数据集上训练了404层网络的模型,在CIFAR-10和CIFAR-100数据集上训练了3002层网络的模型,而原始的残差网络在达到上述...

    CV君
  • 编程十诫,StackOverflow联合创始人的无我编程

    前几天,场主发了一篇《第一份程序员权利法案》,很多程序员朋友都觉得说到点子上了,那么程序员除了应该享有这些权利,还应该遵守怎样的告诫,让自己更优秀呢?

    养码场
  • 程序的腐化原因及建议

    程序你好
  • 怎样编写高质量的Java代码

    代码质量概述 怎样辨别一个项目代码写得好还是坏?优秀的代码和腐化的代码区别在哪里?怎么让自己写的代码既漂亮又有生命力?接下来将对代码质量的问题进行一些粗略的介绍...

    用户1257393
  • Visual Studio 代码风格约束

    注意,这里的错误是IDE1006:Naming rule violation,编译时依然能通过(没找到在哪里设置不允许通过编译):

    雪飞鸿
  • 怎样编写高质量的Java代码

    怎样辨别一个项目代码写得好还是坏?优秀的代码和腐化的代码区别在哪里?怎么让自己写的代码既漂亮又有生命力?接下来将对代码质量的问题进行一些粗略的介绍。也请有过代码...

    哲洛不闹
  • 换工作跳槽感悟 2018-09-28

    7月中下旬跳槽到新公司,算下来到现在已经2个月了。前两个月一直比较忙,现在谈谈工作两个月的感受。

    Yano_nankai

扫码关注云+社区

领取腾讯云代金券