首页
学习
活动
专区
工具
TVP
发布

R语言交流中心

专栏成员
178
文章
613612
阅读量
111
订阅数
R语言实现决策树的分析
决策树分析主要是根据数据的属性建立决策模型。此模型经常被用来解决回归问题和分类问题。常见的算法包括ID3,C4.5,随机森林和CART。其中ID3主要对可选值多的属性具有一定的偏向性;相反,C4.5则主要对可选值少的属性具有一定的偏向性。最终便设计了CART算法来中和这两个极端。CART在特征选取的时候引入了基尼指数,此指数主要是数据纯度的度量方法。所谓数据纯度,就其表面意思便是指的通过特征选择获取的分类结果的纯度情况。当然还有其它的纯度评价函数,那就是信息增益,这个参数可以度量某个特征对分类结果影像的大小,从而确定可以使得模型得到高纯度分类结果的特征属性。接下来我们看下在R中如何实现决策树的分析。实现的包不止一个,包括rpat,party等。我们今天主要介绍party的使用。首先看下包的安装:
一粒沙
2021-04-30
1.7K0
R语言实现贝叶斯优化算法
对于神经网络,机器学习等字眼大家应该都很熟悉,今天我们不谈这个,我们看一下这个在这些模型中一个重要的子领域网络超参数搜索。常见的搜索方法是:试错法(Babysitting)、网格搜索(Grid Search)、随机搜索(Random Search)、贝叶斯优化(Bayesian Optimization)。前面三种都是好理解的,都可以从字面意思进行理解。我们主要讲下这个贝叶斯优化算法。其算法可以转化为一个形式的方程式:
一粒沙
2020-04-27
3.1K0
R语言实现基因表达模式识别
后验概率:事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小{P(事件|原因)}。
一粒沙
2019-10-30
1.2K0
R语言之实现K-mean聚类算法
聚类算法作为无监督的学习方法,在不给出Y的情况下对所有的样本进行聚类。以动态聚类为基础的K均值聚类方法是其中最简单而又有深度的一种方法。K均值的好处是我们可以在了解数据的情况下进行对样本的聚类,当然他也有自己的弱点就是对大数据的运作存在一定的局限。我们以R基础包自带的鸢尾花(Iris)数据进行聚类分析的演示。利用R语言的K均值聚类函数kmeans(),进行聚类,首先我们介绍下kmeans()的构成
一粒沙
2019-07-31
3.2K0
R语言开启人工智能之旅
当下人工智能可谓火热,很多行业在陆续接入相关的功能以及服务。可是大家想不想在R语言中实践下呢? 想不想我都要讲一下,供想实践的参考吧。
一粒沙
2019-07-31
1.7K0
R语言实现支持向量机(SVM)
支持向量机(Support Vector Machine,SVM)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。目前使用广泛的SVM实现工具是libsvm,其不仅集成在很多统计软件例如R,PYTHON等,还可以直接在Linux以及Windows下运行。
一粒沙
2019-07-31
9.2K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档