展开

关键词

R-4- 医学分析

文章目录分类 切入点医学研究思路研究适合的研究数据模型选择 选择适合的分子分类分类模型后模型切入点寻找后或诊断因子的研究 Predictors of xx | xx predictsRisk factors of xx无外部验证的模型建立研究 随机拆分验证交叉验证重抽样内部-外部验证有外部验证的模型建立研究 时段验证:时间分割空间验证:时空验证领域验证模型的验证模型模型的影响研究医学研究思路 模型选择分类变量:logistic回归生存资料 Cox回归计数资料:Poisson负二项回归连续变量:线性回归选择适合的分子阅读文献选择适当的因子 ?

15310

药物R包之oncoPredict

有了前面的教程:药物之认识表达量矩阵和药物IC50 的背景知识铺垫,认识了Cancer Therapeutics Response Portal (CTRP) 和 Genomics of Drug 现在我们可以尝试一下使用R包之oncoPredict对你的表达量矩阵进行药物反应啦! 发表oncoPredict这个包的文献非常新:《oncoPredict: an R package for predicting in vivo or cancer patient drug response and biomarkers from cell line screening data》,这个通讯作者就是2014年r包pRRophetic同一个人,相当于是炒冷饭吧! ) 如果遇到版本问题,请看:https:mp.weixin.qq.comsHGfePIQP4yP_nvhjiWdpAQ使用方法超级简单首先需要读入训练集的表达量矩阵和药物处理信息,参考前面的教程:药物之认识表达量矩阵和药物

50420
  • 广告
    关闭

    90+款云产品免费体验

    提供包括云服务器,云数据库在内的90+款云计算产品。打造一站式的云产品试用服务,助力开发者和企业零门槛上云。

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    药物R包之pRRophetic

    有了前面的教程:药物之认识表达量矩阵和药物IC50 的背景知识铺垫,认识了Cancer Therapeutics Response Portal (CTRP) 和 Genomics of Drug 也介绍了2021年7月新鲜出炉的 药物R包之oncoPredict还可以尝试一下同一个团队早在2014年就出品的R包之 pRRophetic ,也可以对你的表达量矩阵进行药物反应啦! 很有意思的是这个包虽然是2014就发表了,文章是:《pRRophetic: An R Package for Prediction of Clinical Chemotherapeutic Response 25 126 113 具体是什么癌症什么病人就需要看该文章以及该数据集的来源文献啦,但是药物处理结局事件是很明显的,主要是区分R和NR,应该是有无响应的简单情况。 printOutput = TRUE, removeLowVaringGenesFrom = homogenizeData, dataset = cgp2014) 我们首先使用 默认的 cgp2014数据集,来

    1K40

    完整的R语言建模实例-从数据清理到建模

    本文使用Kaggle上的一个公开数据集,从数据导入,清理整理一直介绍到最后数据多个算法建模,交叉验证以及多个模型的比较全过程,注重在实际数据建模过程中的实际问题和挑战,主要包括以下五个方面的挑战:缺失值的挑战异常值的挑战不均衡分布的挑战 (多重)共线性的挑战因子的量纲差异以上的几个主要挑战,对于熟悉机器学习的人来说,应该都是比较清楚的,这个案例中会涉及到五个挑战中的缺失值,量纲和共线性问题的挑战。 数据共包含21个变量,最后一个变量label是需要我们进行的变量,即性别是男或者女 前面20个变量都是我们的因子,每一个都是用来描述声音的量化属性。

    2K50

    R语言股票价格涨跌—基于KNN分类器

    kNN算法R语言实现载入程序包&读入数据library(class) library(dplyr) library(lubridate) library(scatterplot3d) stocks

    2.8K71

    r语言波动率的实现:ARCH模型与HAR-RV模型

    此外,本文使用滚动时间窗方法来计算波动率并构建指数以评估模型的准确性。结果表明,基于长记忆和实现波动率的ARFIMA-RV模型是最准确的模型。 我们发现残差不正常,然后我们试残差的自相关:?试对于上面列出的模型,所有残差都具有一些自相关效应。因此,基于GARCH的模型可能不够准确,无法波动性。 我们使用MSE(误差的均方)来量模型的性能。

    44320

    【数据挖掘与R语言--股票市场收益】目标描述,定义任务

    在该过程中,我们应用标准普尔500指数的历史数据来未来的指数变化。因此我们的模型将包含进一个交易系统中,该交易系统应用模型的结果来生成决策。 定义任务假设从交易方面看,我们认为价格变动超过P%时值得交易(即获利超过交易费用)。在这个假设下,我们需要模型来在未来k天中是否能够获得这个边际利润。 这意味着,未来某个特定时间t+k的报价可能不是最好的方法。事实上,我们需要的是在未来k天中价格总的动态变化,并不是某个特定时间的一个特定价格。 该函数的返回值是一个绘图函数.这意味着可以像调用R的其他函数一样来调用对象addT. ind和对象acidAvgPrice。 总之,我们想要时刻!的正确交易信号。对于历史价格数据,我们将计算每天的T值,并用给定的界限值,用上面给出的方法得到每一天的正确信号。明天我们来讲变量。

    76540

    R语言人口死亡率:用李·卡特模型、非线性模型进行平滑估计

    由于我们缺少一些数据,因此我们想使用一些广义非线性模型。因此,让我们看看如何获​​得死亡率曲面图的平滑估计。我们编写一些代码。

    35120

    R语言人口死亡率:用李·卡特(Lee-Carter)模型、非线性模型进行平滑估计

    由于我们缺少一些数据,因此我们想使用一些广义非线性模型。因此,让我们看看如何获得死亡率曲面图的平滑估计。我们编写一些代码。

    34130

    R语言实现DNA结构

    今天给大家介绍一个来DNA结构的R包DNAshapeR,其从基因组序数据中以超高速、高通量的方式DNA形状特征。该软件包以核苷酸序列或基因组间隔作为输入,并生成各种图形表示,以供进一步分析。 DNA使用滑动五聚体窗口,其中512个不同五聚体中的每一个都有独特的结构特征,从而在每个核苷酸位置(周向)定义了小沟宽(MGW),滚动,螺旋桨扭曲(ProT)和螺旋扭曲(HelT)的向量(周 等人, 序列的结构library(DNAshapeR)fn

    43941

    R语言做钻石价格

    1.2数据说明这里我使用的是R语言里面数据集diamonds,如果看这本《ggplot2:数据分析与图形艺术》应该对这个数据都不会太陌生。该数据集收集了约54000颗钻石的价格和质量的信息。 1.3数据加载到R中由于数据集是R语言自带的,所以我们只要输入下面的命令行查看数据前六行。head(diamond)?1.3.1构建数据sample_date

    87750

    R建立一个临床分类

    文章目录网页服务确定研究目标数据可视化处理 数据值化缺失值处理无量纲化特征选择lasso模型 方法1:生存模型方法2:logistics 结果网页服务网页服务地址确定研究目标研究目标Y:手术后是否复特征因素 编程语言:R语言数据可视化1.散点图: ?

    16210

    R使用LASSO回归股票收益

    使用LASSO收益1.示例只要有金融经济学家,金融经济学家一直在寻找能够股票收益的变量。 首先,你必须使用你的直觉来识别一个新的器,然后你必须使用统计来估计这个新的器的质量:?但是,现代金融市场庞大。可性并不总是发生在易于人们察觉的尺度上,使得解决第一个问题的标准方法成为问题。 因为LASSO可以将除少数系数之外的所有系数设置为零,即使样本长度比可能的变量的数量短得多,它也可用于识别最重要的变量。 在将每个模型拟合到先前的数据之后,然后我在st期间进行样本外回归。然后,我通过分析一系列回归分析调整后的统计数据,检查这些与第一个资产的实现回报的紧密程度。 这就是为什么上面的回归仅使用从而不是使用数据开始的原因。下图显示了模拟中惩罚参数选择的分布。?数量。

    27510

    R中时间序列分析-趋势ARIMA

    时间序列(time series forecasting)ARIMA模型(Autoregressive Integrated Moving Average Model) ARIMA模型,将非平稳时间序列转化为平稳时间序列 install.packages(“forecast”) 拟合曲线的方法 auto.arima(ts) forecast(arimaModel,h)arimaModel ARIMA模型h 需要的时间长度代码实现

    501100

    R语言作上海房价模型

    指数方程房价?三年的值为:20122013201424765.3329298.7534662.03多元线性回归房价? :20122013201427499.3530763.2434245.12模型的对比评价通过收集实际数据,与两个模型进行对比,可对的结果进行评价得到结果如下:两个模型房价与实际房价的对比 : 201220132014实际房价2569129537(截止到5月)无时间指数模型值24765.3329298.7534662.03与实际的偏差比例3.6%6.6%无多因素回归模型值27499.3530763.2434245.12 与实际的偏差比例6.5%4.2%无则可知,指数模型和多因素线性回归模型均得到较好的值,偏差均非常小。 由于某些数据的缺少,有些数据从网上搜索得到,可能会存在不准确的情况,与现实数据可能有所差异,模型仅供参考。 ----

    2.1K70

    不同算法比较实例(R语言)

    算法种类很多,不论是为实际问题选择更好的分类器,还是模型优化中判断模型效果,都需要比较不同算法之间的优劣。本文我们将借助样本数据,演示从数据处理-训练--模型比较全流程的操作实例。 step2对处理后数据进行训练集与试集划分,使用三种算法在训练集上构建分类器,在试集上比较结果。首先使用随机森林构建分类器。 构建好随即森林分类器后,继续将逻辑回归及svm分类器构建完毕,然后将三个分类器分别对试集进行。 step3通过roc曲线比较三个分类器效果。在本例中,随即森林效果最好,逻辑回归效果最差。?

    95620

    R语言ARMA-EGARCH模型、集成算法对SPX实际波动率进行

    SPXdata$SPX2.r 是每日收益(平仓平仓)。  下图显示  了样本外  和相应的实际波动率。显示与实现波动率高度相关,超过72%。 ,但计模型平均值会减少方差,从而提高准确性。 自然的看法是将隐含波动率作为已实现波动率的因子。但是,大量研究表明,无模型的隐含波动率VIX是有偏估计量,不如基于过去实现的波动率的有效。 Torben G. 因此,进一步的发展可能是将时间序列和隐含波动率(如果存在)的信息相结合的集成模型。

    44930

    R语言实现拷贝数变异评估

    我们今天介绍一个和拷贝数评估相关的R包CNAnorm。 首先是R包的安装:source(https:bioconductor.orgbiocLite.R)biocLite(CNAnorm)接下来我们看下具体的实例:我们利用包自带的数据:data(LS041) 数据的结构我们可以看出,有拷贝数的位置(Pos),试的结果(Test),参照的结果(Norm),还有GC的含量。以上的数据可以通过处理sambam文件获得。 如果我们的数据是dataframe格式的数据我们需要使用R包自带的函数dataFrame2object进行处理。在此我们的数据需要进行处理:CN

    71020

    R语言系列第五期:③R语言逻辑回归和检验

    详情点击:R语言系列五:②R语言与逻辑回归建立但是模型建立起来之后,是用来做什么的? 而删掉了smoking之后,的结果就是两两相等的。另外这些值都是在logit刻度下的,所以我们再去计算这个公式里P值解之后就可以得到阳性率。 出现15%的期望和0%的观这样的差别,虽然差别大,但是模型里只有0.3个高血压,而实际是0个,所以要注意相对数使用时容易出现这样的问题。 整体来看,这个图还是有意义的,尽管12-13岁年龄段和13-14年龄段原始数据和数据略有差池。但是这样的偏差是否有统计学意义呢? 其实这个方法并不能非常好的给出结果,我们只能直观的感觉效果如何而异。

    1.4K20

    R语言Lee-Carter模型对年死亡率建模期寿命

    age.GRD.MERE,+ type=l,lwd=2,col=red)再一次,我们可以形象地看到外婆的出生年龄我们可以通过使用Lee-Carter模型对年死亡率进行建模,并推断到当前世纪,我们可以推断出剩余期寿命 1974.0 1947.05 57.45 29.725112005 30.6 30,6 1974.9 1948.04 57.46 29.80398换句话说,在最后一行,2005年,一名57.46岁女性的(剩余)期寿命约为 然后,我们不仅可以看到他祖母的平均年龄,还可以看到她的剩余期寿命,然后我们就可以确定曾祖母的(平均)年龄,以及曾祖母的(剩余)寿命现在我们也可以对这项快速研究的局限性感到疑惑。

    22400

    相关产品

    • 汽车精准获客服务

      汽车精准获客服务

      提供汽车垂直行业人群洞察和线索预测服务,助力车企精准营销与投放,通过腾讯汽车精准营销服务,帮助车企实现数字营销降本增效。

    相关资讯

    热门标签

    扫码关注云+社区

    领取腾讯云代金券