jupyterLab+R,让你更优雅的探索数据

jupyterLab 是神马东西?

现在Rstudio已经成为R社区使用最广泛的集成编辑器,其在配合Rstudio公司开发的软件包使用上有天然的优势,如、、、、等,让我们在数据导入、清洗、可视化、分析过程中少踩了不少坑。

然而,有时候我们也会发现,利用Rmarkdown进行探索性数据分析时,尤其是初学者,总是不断花费时间在文档编译上,而压缩了真正数据探索的时间。很多时候,我很羡慕python用户,因为他们拥有Ipython、jupyter notebook等工具,让我们一边分析数据,一边插入markdown文本,并且还能实时看到结果,这些特性R用户也可以实现吗?当然,这就是我今天推荐的jupyterlab 编辑器。

安装jupyterLab

首先我们要明白,jupyterLab是一个python包,所以要使用jupyterLab首先要配置python环境。对于普通用户,包括linux、win和Mac用户,建议直接下载anaconda发行版进行安装,这样免去了既要安装python又要安装其他包的麻烦,是最简洁的方法。

对于平时很少使用python的人来说,可能无法忍受anaconda全家桶式的安装模式,想更轻便的安装使用,那也很容易。

Mac 和 Linux用户系统自带了python,可以直接使用安装jupyterLab包。

win用户先在python官网下载安装python,然后使用安装jupyterLab包。

在终端输入即可以在默认浏览器中打开编辑器界面,若不能,请检查下python路径配置是否正确。

“咦,怎么只能选择python,R去哪了”,各位看官莫急,这是因为R端缺少必要的包,还不能和jupyter进行通信,等把这些包安装好进行配置后就可以了。

⚠️ 要把先前打开的jupyterLab程序全部关闭后再进行以下操作

jupyterLab的主要特性

绘图函数自动插入图片

ggplot2绘图完美支持

动态绘图没问题

网页也可以

也可以直接插入包官网示例,这里需要用到包提供的函数。其核心思想是使用函数将示例网页封装为iframe进行输出。

这一方法可以用来插入任何网页,包含视频、音频等等。当然,相应地高度、宽度需要进行针对性调整。

leaflet地图也很容易

插入常见统计报表

数据框、矩阵格式化输出

更复杂的表格输出

统计报表输出

latex数学公式支持

添加公式的方法

jupyterLab 数学公式本质上是调用的MathJax宏包进行处理的,因此要使用数学公式需要把单元格设置为markdown模式。可以通过下拉菜单进行手动设置,也可以选中单元格,按退出编辑模式,然后按进行设置。

行内公式样式为,公式内容通过两个美元符号包裹起来。例如,这里是行内公式,编译后显示为∑k=1∞xnn!

k=1

n!

x

n

行间公式样式为,公式内容前后各两个美元符号。例如,这里是行间公式,编译后显示为:

更复杂的数学公式解决办法

很多时候需要写条件函数,需要使用环境。

公式组使用环境。

矩阵代数直接使用环境。

对齐使用环境。

最后还说下公式自动编号。我在测试时直接使用环境并没有得到编号的公式。具体原因我还不清楚。

快捷键

要熟悉jupyter快捷键,必须要要清楚jupyter单元格(cell)分编辑模式和非编辑模式,快捷键都是在非编辑模式下才能起作用。

:运行本单元,选中下个单元

:运行本单元

:切换单元格为非编辑模式

:切换单元格为编辑模式

:删除选中单元格

:在上方插入单元格

:在下方插入单元格

:切换单元格为markdown模式

:切换单元格为raw模式

:切换单元格为code模式

jupyter 提供了大量的快捷键方便使用,平时我用的最多的就上面一些,其他的可以参照lawme的专栏文章。

写在最后的话

jupyterLab比较适合进行探索性数据分析和学习,在使用过程中最大的缺点是当文档过大,或者涉及很多动态页面生成时容易卡顿。与之相对的,使用Rstudio结合Rmarkdown生成最终报告文档可能更合适,两者各有优缺点,需要结合使用。

PS:第一次写,有什么疏忽各位砖轻点拍

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180718G16K0200?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

同媒体快讯

扫码关注云+社区

领取腾讯云代金券