R开发:常用R语言包介绍

r与python差异比较大的一个地方就是,python的机器学习算法集中程度比较高,比如sklearn,就集成了很多的算法,而R语言更多时候需要一个包一个包去了解,比较费时费力,对于python转过来的朋友非常不友好,抽空整理了工作中常用的R包如下:

常用检验函数:

基本上分布中常见的都罗列了:

常用作图函数包:

ggplot2:万能,基本上excel能画的图它都能画

rattle:fancyRpartPlot函数,决策树画图函数

基础包函数:barplot、pie、dotchart、hist、densityplot、boxplot、contour等等

正态检验:qqplot、qqline、qqnorm

连续分类回归模型:

stats包 lm函数,实现多元线性回归;glm函数,实现广义线性回归;nls函数,实现非线性最小二乘回归;knn函数,k最近邻算法

rpart包 rpart函数,基于CART算法的分类回归树模型

randomForest包 randomForest函数,基于rpart算法的集成算法

e1071包 svm函数,支持向量机算法

kernlab包 ksvm函数,基于核函数的支持向量机

nnet包 nnet函数,单隐藏层的神经网络算法

neuralnet包 neuralnet函数,多隐藏层多节点的神经网络算法

RSNNS包 mlp函数,多层感知器神经网络;rbf函数,基于径向基函数的神经网络

离散分类回归模型:

stats包 glm函数,实现Logistic回归,选择logit连接函数

kknn包 kknn函数,加权的k最近邻算法

rpart包 rpart函数,基于CART算法的分类回归树模型

adabag包bagging函数,基于rpart算法的集成算法;boosting函数,基于rpart算法的集成算法

party包ctree函数,条件分类树算法

RWeka包OneR函数,一维的学习规则算法;JPip函数,多维的学习规则算法;J48函数,基于C4.5算法的决策树

C50包C5.0函数,基于C5.0算法的决策树

e1071包naiveBayes函数,贝叶斯分类器算法

klaR包NaiveBayes函数,贝叶斯分类器算分

MASS包lda函数,线性判别分析;qda函数,二次判别分析

聚类:Nbclust包Nbclust函数可以确定应该聚为几类

stats包kmeans函数,k均值聚类算法;hclust函数,层次聚类算法

cluster包pam函数,k中心点聚类算法

fpc包dbscan函数,密度聚类算法;kmeansruns函数,相比于kmeans函数更加稳定,而且还可以估计聚为几类;pamk函数,相比于pam函数,可以给出参考的聚类个数

mclust包Mclust函数,期望最大(EM)算法

关联规则:arules包apriori函数

Apriori关联规则算法

recommenderlab协调过滤

DRM:重复关联

ECLAT算法: 采用等价类,RST深度搜索和集合的交集: eclat

降维算法:

psych包prcomp函数、factanal函数

时序分析:

ts时序构建函数

timsac包时序分析

holtwinter包时序分析

decomp、tsr、stl成分分解

zoo 时间序列数据的预处理

统计及预处理:

常用的包 Base R, nlme

aov, anova 方差分析

density 密度分析

t.test, prop.test, anova, aov:假设检验

rootSolve非线性求根

reshape2数据预处理

plyr及dplyr数据预处理大杀器

最后剩下常用的就是读入和写出了:

RODBC 连接ODBC数据库接口

jsonlite 读写json文件

yaml 读写yaml文件

rmakdown写文档

knitr自动文档生成

一般业务中使用比较多的就是上面这些了,当然R里面有很多冷门的包,也很好用滴~

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏小鹏的专栏

为什么很多做人脸的Paper会最后加入一个Local Connected Conv?

Deep face:论文。 a. 人脸检测,使用6个基点 b. 二维剪切,将人脸部分裁剪出来 c. 67个基点,然后Delaunay三角化,在轮廓处添加三角形来...

38150
来自专栏机器之心

教程 | 重新发现语义分割,一文简述全卷积网络

语义分割是一种学习如何识别图像中对象范围的机器学习技术。语义分割赋予机器学习系统与人类相似的理解图像内容的能力。它促使机器学习算法定位对象的精准边界,无论是街景...

18720
来自专栏一心无二用,本人只专注于基础图像算法的实现与优化。

基于模糊集理论的一种图像二值化算法的原理、实现效果及代码

  这是篇很古老的论文中的算法,发表与1994年,是清华大学黄良凯(Liang-kai Huang) 所写,因此国外一些论文里和代码里称之为Huang's fu...

331110
来自专栏机器学习算法原理与实践

word2vec原理(一) CBOW与Skip-Gram模型基础

    word2vec是google在2013年推出的一个NLP工具,它的特点是将所有的词向量化,这样词与词之间就可以定量的去度量他们之间的关系,挖掘词之间的...

21820
来自专栏机器之心

机器之心GitHub项目:从循环到卷积,探索序列建模的奥秘

机器之心原创 作者:蒋思源 本文讨论并实现了用于序列模型的基本深度方法,其中循环网络主要介绍了传统的 LSTM 与 GRU,而卷积网络主要介绍了最近 CMU 研...

97560
来自专栏CreateAMind

TensorFlow 文档:MNIST机器学习入门

14620
来自专栏程序生活

机器学习(四)通过递归的矩阵向量空间预测组合语义摘要简介方法结果结论

Semantic Compositionality Through Recursive Matrix-Vector Spaces 摘要 单字矢量空间模型已经在学...

36570
来自专栏人工智能LeadAI

pytorch入门教程 | 第三章:构造一个小型CNN

学过深度卷积网络的应该都非常熟悉这张demo图(LeNet): ? 此图是LeNet的结构图,把32*32的手写英文字符图片作为输入,训练出一个对于手写字符的分...

39470
来自专栏老秦求学

基于Keras的imdb数据集电影评论情感二分类

二分类可能是机器学习最常解决的问题。我们将基于评论的内容将电影评论分类:正类和父类。

50930
来自专栏数据星河

人工智能之机器学习CART算法解析

  人工智能之机器学习主要有三大类:1)分类;2)回归;3)聚类。今天我们重点探讨一下CART算法。

16900

扫码关注云+社区

领取腾讯云代金券