首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

药物预测R包之pRRophetic

有了前面的教程:药物预测之认识表达量矩阵和药物IC50 的背景知识铺垫,认识了Cancer Therapeutics Response Portal (CTRP) 和 Genomics of Drug...也介绍了2021年7月新鲜出炉的 药物预测R包之oncoPredict 还可以尝试一下同一个团队早在2014年就出品的R包之 pRRophetic ,也可以对你的表达量矩阵进行药物反应预测啦!...,里面的病人预测得到的药物越敏感!...预测全部的药物 这个时候因为是每个药物都需要走前面的 pRRophetic包的核心函数pRRopheticPredict,所以可以写循环啦,而且可以加入并行机制。...这个时候其实可以看看 前面的2021年7月新鲜出炉的 药物预测R包之oncoPredict 结果跟本次介绍的药物预测R包之pRRophetic的一致性!

12.3K71

R语言实现DNA结构预测

今天给大家介绍一个来预测DNA结构的R包DNAshapeR,其从基因组测序数据中以超高速、高通量的方式预测DNA形状特征。该软件包以核苷酸序列或基因组间隔作为输入,并生成各种图形表示,以供进一步分析。...DNA预测使用滑动五聚体窗口,其中512个不同五聚体中的每一个都有独特的结构特征,从而在每个核苷酸位置(周向)定义了小沟宽(MGW),滚动,螺旋桨扭曲(ProT)和螺旋扭曲(HelT)的向量(周 等人,...序列的结构预测 library(DNAshapeR) fn <- system.file("extdata","CGRsample.fa", package = "DNAshapeR") pred <-...利用公共的平台去检索对应的基因序列做结构预测,当然,我们参考的这个平台的包需要连接外网。...预测CpG甲基化背景下的DNA形态特征,可以制备一个FASTA序列文件,其中符号Mg: M表示前导链上甲基化CpG的胞嘧啶,符号g表示后随链上甲基化CpG的胞嘧啶。

1.4K41

R语言做钻石价格预测

1.2数据说明 这里我使用的是R语言里面数据集diamonds,如果看这本《ggplot2:数据分析与图形艺术》应该对这个数据都不会太陌生。该数据集收集了约54000颗钻石的价格和质量的信息。...1.3数据加载到R中 由于数据集是R语言自带的,所以我们只要输入下面的命令行查看数据前六行。 head(diamond) ?...1.7获取预测模型 因为我们主要是的研究目的是预测预测测试数的钻石价格;不过从数据结构和数据分布上来看,我们可以使用回归模型和随机森林两类预测模型模型;在回归类的模型中我们可以考虑使用多元线性回归和回归决策树两种模型...,到时候我们在建立一个评估模型的函数看哪个模型的预测误差小 1.7.1多元线性回归 这里我们使用Lm函数对数据进行拟合,预测变量是价格,因此我们先初步对多元线性回归模型的一个探索先 lm_model <...,R会生成一组辅助变量,对每一个有K个水平的因子变量,R会生成K-1个辅助变量,辅助比那辆的值为0或者1,当辅助变量的值为1,表示该因子出现,同时表明其他所有辅助变量值为0,以上结果汇总;所以从上图结果我们可以看得出来

1.7K50

R使用LASSO回归预测股票收益

使用LASSO预测收益 1.示例 只要有金融经济学家,金融经济学家一直在寻找能够预测股票收益的变量。...首先,你必须使用你的直觉来识别一个新的预测器,然后你必须使用统计来估计这个新的预测器的质量: ? 但是,现代金融市场庞大。...因为LASSO可以将除少数系数之外的所有系数设置为零,即使样本长度比可能的预测变量的数量短得多,它也可用于识别最重要的预测变量。...在将每个模型拟合到先前的数据之后,然后我在st期间进行样本外预测预测回归。然后,我通过分析一系列预测回归分析调整后的统计数据,检查这些预测与第一个资产的实现回报的紧密程度。...这就是为什么上面的预测回归仅使用从而不是使用数据开始的原因。下图显示了模拟中惩罚参数选择的分布。 ? 预测数量。

1.1K10

完整的R语言预测建模实例-从数据清理到建模预测

本文使用Kaggle上的一个公开数据集,从数据导入,清理整理一直介绍到最后数据多个算法建模,交叉验证以及多个预测模型的比较全过程,注重在实际数据建模过程中的实际问题和挑战,主要包括以下五个方面的挑战:...数据共包含21个变量,最后一个变量label是需要我们进行预测的变量,即性别是男或者女 前面20个变量都是我们的预测因子,每一个都是用来描述声音的量化属性。...但是我们更关注的是,预测因子之间是不是存在高度的相关性,因为预测因子间的香瓜性对于一些模型,是有不利的影响的。...因此,我们将我们的数据集的70%的数据用来训练模型,剩余的30%用来检验模型预测的结果。...因为原生的R只支持单进程,通过我们的设置,可以将四个核都使用起来,可以大为减少我们的计算时间。 我们最后的一个步骤就是要将三个模型进行比较,确定我们最优的一个模型: ?

3.1K50

R语言逻辑回归预测分析付费用户

对于付费用户预测,主要是思考收入由哪些因素推动,再对每个因素做预测,最后得出付费预测。这其实不是一个财务问题,是一个业务问题。 流失预测。...问题描述 我们尝试并预测用户是否可以根据数据中可用的人口信息变量使用逻辑回归预测月度付费是否超过 50K。...构建Logit模型和预测 确定模型的最优预测概率截止值默认的截止预测概率分数为0.5或训练数据中1和0的比值。但有时,调整概率截止值可以提高开发和验证样本的准确性。...其每一列代表预测值,每一行代表的是实际的类别。这个名字来源于它可以非常容易的表明多个类别是否有混淆(也就是一个class被预测成另一个class)。...基于此用户规模预测模型,结合用户的人口信息,即可粗略预估产品在一般情况下的收入情况, 从而判断就得到了付费用户预测模型,如果把收入分类转换成流失用户和有效用户,就得到了流失用户预测模型。

94100

【数据挖掘与R语言--预测股票市场收益】目标描述,定义预测任务

在该过程中,我们应用标准普尔500指数的历史数据来预测未来的指数变化。因此我们的预测模型将包含进一个交易系统中,该交易系统应用模型的预测结果来生成决策。...这意味着,预测未来某个特定时间t+k的报价可能不是最好的方法。事实上,我们需要预测的是在未来k天中价格总的动态变化,并不是预测某个特定时间的一个特定价格。...<-matrix(NA,ncol=n.days,nrow=NROW(quotes)) + for(x in 1:n.days) r[,x] <-Next(Delt(Cl(quotes),v,k=x)...,x) + x tgt.margin | x < -tgt.margin])) + if (is.xts(quotes)) xts...该函数的返回值是一个绘图函数.这意味着可以像调用R的其他函数一样来调用对象addT. ind和对象acidAvgPrice。

1.7K40

R语言系列第五期:③R语言逻辑回归预测和检验

详情点击:R语言系列五:②R语言与逻辑回归建立 但是模型建立起来之后,是用来做什么的?...(pre.obs$prob),] # 我们把所有预测和实际值对子按照预测概率的大小由小到大排序 > n<-nrow(pre.obs) # 计算总行数,就是总的观测数 > tpr<-fpr<-rep(0,...另外,R里也有专门的ROC绘制包,比如ROCR包(不做详细解释,直接套用就可以了,这个包会直接给出来AUC值,即曲线下面积的大小。...关于逻辑回归的建立,预测和诊断我们都已经介绍完了,下面就是关于生存分析的部分了。敬请期待。 参考资料: 1.《R语言统计入门(第二版)》人民邮电出版社 Peter Dalgaard著 2....《R语言初学者指南》人民邮电出版社 Brian Dennis著 3.Vicky的小笔记本《blooming for you》by Vicky

3.2K20

R语言使用ARIMA模型预测股票收益时间序列

在这篇文章中,我们将介绍流行的ARIMA预测模型,以预测股票的收益,并演示使用R编程的ARIMA建模的逐步过程。 时间序列中的预测模型是什么?...最后,我们交叉检查我们的预测值是否与实际值一致。 使用R编程构建ARIMA模型 现在,让我们按照解释的步骤在R中构建ARIMA模型。有许多软件包可用于时间序列分析和预测。...我们的目标是从断点开始预测整个收益序列。我们将在R中使用For循环语句,在此循环中,我们预测测试数据集中每个数据点的收益值。...结论 最后,在本文中,我们介绍了ARIMA模型,并将其应用于使用R编程语言预测股票价格收益。我们还通过实际收益检查了我们的预测结果。...---- 本文选自《R语言使用ARIMA模型预测股票收益时间序列》。

2.2K10
领券