2017年11月R新包推荐

一. 文档概述

11月份,在R官方(CRAN)共计发布了237个新包,本文选摘了40个R包,包含以下几个类别:计算方法、数据、数据科学、科学、社会科学、工具及可视化等,其余包大家可登录CRAN自行查看,希望有助于大家的学习,感谢大家对R语言中文社区的支持!

二. 详细介绍

1. 计算方法

1)CVXR v0.94-4: 实现了一种面向对象建模语言,用于规范的凸规划(DCP),允许用户制定和解决凸优化问题.

2)PreciseSums v0.1: 实现了Kahan(1965) 和Neumaier(1974)的summation算法.

2. 数据

1)ballr v0.1.1: 提供数据接口/函数获取篮球站点数据(basketball-reference.com)

2)biofiles v1.0.0: 提供函数来解析GenBank / GenPept记录到本机R对象,访问和操作序列、注释信息.

3)ipumsr v0.1.1: 支持用户从IPUMS(世界人口微观共享数据库)导入人口普查、调查和地理数据,在R中进行处理、可视化等操作.

4)proPubBills v0.1: 对ProPublica API进行封装,可以通过该包进行相关操作.(ProPublica是一家针对美国社会公共兴趣进行调查报道的独立非营利机构)

5)Rpolyhedra v0.1.0: 包含142个多面体数据库,从PHD文件中获取R6对象,并提供rgl 可视化功能.

6)voteogram v0.2.0: 支持从ProPublica检索美国国会投票数据,同时使用ggplot2进行可视化展示,创建投票统计图和主题.

3. 数据科学

1)imbalance v0.1.1: 提供了多种算法处理不平衡数据集(重点推荐).

2)intrinsicdimension v1.1.0: 为评估数据集的内在维度实现了多种方法,该问题出现在 Johnsson等人的论述中.

3)ppclust v0.1.0: 实现分区数据集的概率聚类算法,包括Fuzzy C-Means (Bezdek, 1974), Possibilistic C-Means (Krishnapuram & Keller, 1993)等.

4)textrank v0.2.0: 实现textrank算法,这是文本的Pagerank算法的扩展.

5)TrajDataMining v0.1.4: 包含一组用于轨迹数据准备的方法,如过滤、压缩和聚类,以及轨迹模式的发现.

4. 科学

1)benthos v1.3-4: 为分析海洋底栖生物数据,提供数据预处理工具和生物多样性度量工具.

2)nlmixr v0.9.0-1: 在药物动力学和药效学中,提供了常见的弹性剂量信息的微分方程非线性混合效应模型的拟合和比较函数.

3)PCRedux v0.2.5-1: 提供了提取聚合酶链反应(qPCR)放大曲线数据的功能.

Clustering via Hausdorff distance

4)PDN v0.1.0: 通过Cabrera等人的论文(2016),提供建立病人水平网络的工具来预测医疗结果.

5)Rraven v1.0.0: 提供一种工具来交换R和Raven声音分析软件之间的数据.

6)spew v1.3.0: 提供用于生成合成人口和生态系统的工具.

5. 社会科学

1)EvolutionaryGames v0.1.0: 提供一组工具来说明进化博弈理论的核心概念,如进化稳定性、各种进化动力学,可用于教学和学术研究.

6. 统计学

1)[bang(https://CRAN.R-project.org/package=bang)] v1.0.0: 提供了一些简单通用模型的贝叶斯分析函数,不使用马尔可夫链蒙特卡洛(MCMC)方法,如Gibbs抽样.

2)beast v1.0: 给出了多元时间序列中变化点的贝叶斯估计方法.

3)CorShrink v0.1.1: 提供函数来执行相关/协方差矩阵的自适应收缩,在关联的Fisher z变换之前使用混合模型.

4)dvmisc v1.1.1: 提供基础R函数的更快版本(例如,平均值、标准偏差、协方差、加权平均值),主要是用c++编写.

5)inlabru v2.1.2: 通过INLA包,使用集成嵌套拉普拉斯逼近进行空间建模,并实现了对单变量和空间点过程建模中,实现对数高斯Cox过程.

6)outbreaker2 v1.0-0: 允许用户利用流行病学和遗传信息重建疾病暴发.

7)probout v1.0: 提供函数来估计多变量数值数据的非监督离群概率,并通过非参数离群统计量进行观测.

8)quokar v0.1.0: 为分位数回归模型提供诊断方法,包括检测有影响的观测值、鲁棒距离法、广义库克距离、平均后验概率和kullback - leibler散度方法.

9)tidyposterior v0.0.1: 这个令人难忘的命名包实现了一个Bayesian方法来检验模型之间的差异,目的是为了回答这个问题:“当考虑重新采样的结果时,模型之间的区别是真实的吗?”这些方法与Benavoli等人(2017)所描述的方法相似.

Robust Distance-Residual Plot

10)trialr v0.0.1: 提供一个贝叶斯临床试验设计的展示,在RStan包和R中实现,同时包含第一次在R中实现的一些设计 (例如:EffTox’ by Thall & Cook (2004).

11)tvReg v0.2.1: 针对独立的和相关的方程,提供了时间变系数拟合方程的函数.

7. 工具

1)cli v1.0.0: 实现了一套旨在构建具有吸引力的命令行界面的工具.

2)float v0.1-1: 扩展了R的线性代数功能,包括32位浮点(单精度)数据.

3)mudata2 v1.0.0: 提供易于组织和可视化时空数据的功能和数据结构.

4)rhub v1/0.2: 为R-Hub提供了一个接口,该系统由R联盟发起.

8. 可视化

1)ALEPlot v1.0: 在黑箱监督学习模型中,提供了可视化个体预测变量的主要影响和二阶交互影响的功能

2)dbplot v0.1.1: 利用dplyr包处理数据库内的图形计算功能.

3)ggalluvial v0.5.0: 使用ggplot2的stat和geom图层,展示冲积图以及可视化多个数据类型派生的关联结构.

4)shinyaframe v1.0.1: 使用户能够在基于web的虚拟现实体验中获得R数据,用于沉浸式、跨平台的数据可视化.

5)tactile v0.1.0: lattice包的扩展,提供新的高级函数、现有函数的方法、面板函数和主题.

附注:本文由黄小伟翻译,限于个人水平,如有错误,欢迎批评指正!

本文来自企鹅号 - R语言中文社区媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

川大毕业极客创建项目《深度学习500问》,GitHub获星近万!

近年来,深度学习在语音、图像、自然语言处理等领域都取得了非常不错的成果,自然而然地成为技术人员争相学习的热点。

11340
来自专栏数据科学与人工智能

【数据可视化】数据可视化的正确操作方法

数据可视化,是一种用来将复杂信息数据清晰表述出来的强大有力的工具。通过可视化信息,我们的大脑可以更有效地合成和保留信息内容,增强对信息的理解。但是如果不正确数据...

27660
来自专栏程序生活

Gensim实现Word2Vec的Skip-Gram模型简介快速上手对语料进行分词使用gensim的word2vec训练模型

简介 Genism是一个开源的Python库,用于便捷高效地提取文档中的语义话题。它用于处理原始的、非结构化的电子文本(“纯文本”),gensim中的一些算法,...

50140
来自专栏开源优测

大数据测试学习笔记之Python工具集

这是2018年度业余主要学习和研究的方向的笔记:大数据测试 整个学习笔记以短文为主,记录一些关键信息和思考 预计每周一篇短文进行记录,可能是理论、概念、技术、工...

51360
来自专栏小小挖掘机

推荐系统实战-基于用户的协同过滤

1、数据集简介 MovieLens数据集包含多个用户对多部电影的评级数据,也包括电影元数据信息和用户属性信息。 这个数据集经常用来做推荐系统,机器学习算法的测试...

63160
来自专栏PPV课数据科学社区

基于scikit-learn的机器学习简介

基于scikit-learn的机器学习简介 作者:陆勤(专注机器学习研究和应用) 基于scikit-learn的机器学习简介,包括以下内容: 机器学习:问题集...

37080
来自专栏逍遥剑客的游戏开发

游戏中的战争迷雾

948110
来自专栏AI黑科技工具箱

1.试水:可定制的数据预处理与如此简单的数据增强(上)

说实话,在我仔细研究了MXNet和Gluon是如何进行数据加载与数据增强的,不得不佩服DMLC真的很良心,提供了如此简单的接口和又方便又多样的数据处理工具库。

265100
来自专栏IT派

【AI速查表】神经网络、机器学习、深度学习与数据科学一览

1. 神经网络 ? 2. 神经网络结构 ? 3. 神经网络公式 ? ? 4. 机器学习:概览 ? 5. 机器学习:Scikit-learn算法 ? Scik...

32960
来自专栏PPV课数据科学社区

只需七步就能掌握Python数据准备

摘要: 本文主要讲述了如何在python中用七步就能完成中数据准备。 上图为CRISP-DM模型中的数据准备   下面七个步骤涵盖了数据准备的概念,个别任务...

34270

扫码关注云+社区

领取腾讯云代金券