精选|2018年7月R新包推荐

作者 | Joseph Rickert

翻译 | 黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职于网易杭州

来源 | 公众号:R语言中文社区

7月份,大约有251个R新包收录于CRAN。除7月份新包数量远超6月份之外,R新包的质量和多样性上也有明显的进步。比如tropicalSparse,抽象数学研究与分析;eChem,分析化学方向的研究应用。

以下是节选的40个R新包,主要包括十个类别:计算方法、数据、经济、机器学习、数学、科学、统计学、时间序列、工具和可视化。

一. 计算方法

1. osqp: 提供了与OSQP求解器的绑定(数值优化), 用于求解基于C语言编写的凸二次型程序.

2. sundailr: 提供一种在SUNDIALS中调用函数的方法.

二. 数据

1. fredr: 支持在R中获取美联储经济数据 (FRED),并进行相关分析与研究.

2. jstor: 提供导入元数据、ngrams和全文的功能,进行研究分析.

3. rLandsat: 提供使用Development Seed和美国地质调查局构建的API搜索和获取Landsat数据的功能.

4. weathercan: 提供从加拿大环境和气候变化网站下载历史天气数据的工具,可以在特定日期范围内从多个工作站下载数据,并自动处理为单个数据集.

三.经济

1. beezdemand: 支持在行为经济需求研究中进行的分析,包括Stein等人(2015)提出的数据筛选和模型拟合等多种方法.

2. sgmodel: 对于用户给定的参数,提供计算通用随机增长模型解的函数.

四. 机器学习

1. bigdatadist: 提供函数来计算概率、曲线样本的熵、函数数据的距离和深度度量以及高维数据的广义马氏核距离.

2. L0Learn: 提供了一个优化的工具包,用于近似解决L0规则化的学习问题.

五. 数学

1. tropicalSparse: 通过应用稀疏矩阵存储技术,实现了稀疏矩阵的一些基本热带代数计算功能.

六. 科学

1. eChem: 提供用于分析化学课程的工具,函数模拟循环伏安法、线性扫描伏安法、单脉冲和双脉冲计时安培法、以及利用Brown(2015)中概述的隐式有限差分法进行计时比例尺实验.

2. RaceID: 利用Herman、Sagar和Grun D.的StemID2算法,实现细胞类型推断和谱系树预测(2018).

3. updog: 实施经验贝叶斯方法,从下一代测序数据中对多倍体进行基因分型,同时考虑等位基因偏差、过度离散和测序错误.

七.统计学

1. adaptMT: 实现了自适应的p值阈值(AdaPT),包括一个允许用户指定任何算法来学习本地错误发现率的框架、以及一个实现特定算法的便捷函数池.

2. biglmm: 针对无法直接加载进内存的数据,提供回归模型构建的功能.

3. circumplex: 提供用于分析和可视化循环数据的工具,包括Zimmermann&Wright(2017)的自举结构汇总方法的概括、以及从结果中创建出版物表和数字的功能.

4. MultiFit: 提供测试两个随机向量的独立性的功能.

5. PHEIndicatormethods: 支持使用制定英国公共卫生指标(如通过指尖提供的指标)的方法,计算常用的公共卫生统计数据及其置信区间.

6. robmixglm: 使用混合方法实现稳健的广义线性模型(GLM),如Beath(2018)中所述.

7. SingelCaseES: 提供计算单个案例设计中基本效应指数的功能,包括几个非重叠测量和参数效应大小测量、以及用于估计Swan和Pustejovsky(2018)开发的渐进效应模型等.

8. spCP: 实现具有独特截距、斜率、方差截距和斜率以及每个位置均为变化点的空间变点模型.

9. TDAstats: 提供拓扑数据分析工具集,特别是计算Vietoris-Rips复合体中的持久同源性.

八.时间序列

1. rollRegress: 实现快速滚动和扩展线性回归模型的方法.

九.工具

1. anyLib: 提供从CRAN、Bioconductor和GitHub安装、加载包列表的功能.

2. dbx: 提供选择、插入、更新和删除数据操作的功能,目前支持的数据库主要

PostgreSQL, MySQL, SQLite.

3. envnames: 提供函数来跟踪用户定义的环境名,其无法使用基本R函数environmentName()进行检索。这个包中的主函数environment_name()将环境的名称作为参数返回.

4. librarian: 提供在单个函数调用中自动安装、更新和加载CRAN和GitHub上R包的函数.

5. makeParallel: 提供自动将串行R代码转换为更高效的并行版本的功能.

6. metaDigitise: 提供从研究论文中的已发表数据中提取、汇总和数字化数据的功能.

7. RSuite: 提供一组与R Suite一起使用的工具,用于开发数据科学工作流程.

十.可视化

1. ceterisParibus: 提供在特征空间中的选定点周围创建“假设?”模型响应图的功能.

2. cytofan: 在ggplot2中实现细胞计数数据的可视化展示.

3. fingertipscharts: 针对英国Fingertips站点上提供的公共健康数据,支持可视化的优化.

4. ggvoronoi: 借助deldir和ggplot2,提供函数创建、操作和可视化沃龙诺依图.

说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~

本文分享自微信公众号 - 数据森麟(shujusenlin)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-09-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习算法与Python学习

人脸照片秒变艺术肖像画:清华大学提出APDrawingGAN CVPR 2019 oral paper

该项工作被CVPR 2019录取为oral paper。CVPR是计算机视觉和人工智能领域内的国际顶级会议,2019共收到投稿5160篇,录取1300篇,其中o...

11230
来自专栏AI科技大本营的专栏

谷歌NIPS论文Transformer模型解读:只要Attention就够了

导读:在 NIPS 2017 上,谷歌的 Vaswani 等人提出了 Transformer 模型。它利用自我注意(self-attention)来计算其输入和...

11830
来自专栏机器学习算法与Python学习

做目标检测,这一篇就够了!2019最全目标检测指南

计算机视觉是一门研究如何对数字图像或视频进行高层语义理解的交叉学科,它赋予机器“看”的智能,需要实现人的大脑中(主要是视觉皮层区)的视觉能力。

12830
来自专栏不仅仅是python

机器学习相关的python库介绍

顾名思义,机器学习是计算机编程的科学,通过它可以从不同类型的数据中学习。Arthur Samuel给出的更一般的定义是 - “机器学习是一个研究领域,它使计算机...

11220
来自专栏WOLFRAM

时间就是生命:用树莓派和Wolfram神经网络创建虚拟飞行副驾

"There's some good magic going on in that neural networks algorithm..."

12830
来自专栏机器学习理论与数据竞赛实战

李航《统计学习方法》决策树ID3算法实现

机器学习算法其实很古老,作为一个码农经常会不停的敲if, else if, else,其实就已经在用到决策树的思想了。只是你有没有想过,有这么多条件,用哪个条件...

12950
来自专栏AI研习社

计算机视觉算法工程师面试总结

校招尘埃落定了,由于最近一直在忙毕业论文,现在才腾出时间总结一下面试经历,因为最近人工智能的火爆,所以今年算法岗竞争也相当激烈,投了很多公司也踩了很多坑,最后也...

28210
来自专栏AI算法与图像处理

计算机视觉中的注意力机制(Visual Attention)

本文将会介绍计算机视觉中的注意力(visual attention)机制,本文为了扩大受众群体以及增加文章的可读性,采用递进式的写作方式。第1部分的全部以及第2...

39130
来自专栏有三AI

【每周CV论文推荐】 初学GAN必须要读的文章

欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。

11030
来自专栏机器学习算法与Python学习

【ML小白】10 个机器学习 Q&A,面试必知!

本文整理了一些最常见的机器学习面试问题及其相应的回答。机器学习有志者以及经验丰富的ML专业人员可以在面试前以此巩固其基础知识。

8530

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励