首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【R语言】因子临床分组应用

前面给大家简单介绍了 ☞【R语言】R因子(factor) 今天我们来结合具体例子给大家讲解一下因子临床分组应用。 我们还是以TCGA数据CHOL(胆管癌)这套数据为例。...关于这套临床数据下载可以参考 ☞如何从TCGA数据库下载RNAseq数据以及临床信息(一) 前面我们也给大家介绍过一些处理临床数据小技巧 ☞【R语言】卡方检验和Fisher精确检验,复现临床paper...*","stage I/II",stage) #转换成因子 stage=factor(stage) stage 可以得到下面这个两分组因子 方法二、直接使用factor函数 #删除组织病理学分期末尾...gsub一样结果 参考资料: ☞【R语言】R因子(factor) ☞如何从TCGA数据库下载RNAseq数据以及临床信息(一) ☞【R语言】卡方检验和Fisher精确检验,复现临床paper...☞R生成临床信息统计表 ☞玩转TCGA临床信息 ☞TCGAbiolinks获取癌症临床信息 ☞肿瘤TNM分期 ☞R替换函数gsub

3.2K21
您找到你想要的搜索结果了吗?
是的
没有找到

R语言 分组计算,不止group_by

最近在研究excel透视图,想到好像自己R-分组操作并不是很流畅,顺便学习分享一下。R自带数据集比较多,今天就选择一个我想对了解mtcars数据集带大家学习一下R语言中分组计算(操作)。...接触了Hadley Wickham神包tidyverse以后感觉数据操作那么简单,这里介绍一种可以实现分组计算/操作方法,就是plyrsplit-apply-combine思想 2.1 ddply...语法 ddply(.data, .variables, ... ) .data为数据集 .variables分组变量一定要在“点+括号”,例如"....(group, sex)" ...为计算函数,可以是一个也可以是多个, 2.2 ddply分组计算示例 > library(plyr); library(dplyr) > dfx <- data.frame...中分组变量一定要在“点+括号”,例如".

7.9K50

分组统计你只想到group_by操作

最近在研究excel透视图,想到好像自己R-分组操作并不是很流畅,顺便学习分享一下。R自带数据集比较多,今天就选择一个我想对了解mtcars数据集带大家学习一下R语言中分组计算(操作)。...接触了Hadley Wickham神包tidyverse以后感觉数据操作那么简单,这里介绍一种可以实现分组计算/操作方法,就是plyrsplit-apply-combine思想 2.1 ddply...语法 ddply(.data, .variables, ... ) .data为数据集 .variables分组变量一定要在“点+括号”,例如"....(group, sex)" ...为计算函数,可以是一个也可以是多个, 2.2 ddply分组计算示例 > library(plyr); library(dplyr) > dfx <- data.frame...中分组变量一定要在“点+括号”,例如".

95630

【R语言】三种批量做T检验方法

其实这里我们是做了16次t检验才得到每个基因p值。 首先我们把16个m6a基因得表达谱读进来,最后一列为样本类型,也是我们待会做t检验时候分组依据。...具体如何得到这个表达矩阵可以参考 ☞m6a甲基化相关基因boxplot并显示p值 #读取16个m6a甲基化相关基因在CHOL表达量 m6a_expr_type=read.table(file=...("reshape2") #加载plyr和reshape2包 library(plyr) library(reshape2) #melt对m6a_expr_type数据格式进行转换 ddply(melt...方法得到结果是一样 再给大家分享两个小技巧,计算原始p值同时,我们还能计算校正之后p值 #使用fdr方法对原始p值进行校正 result=melt(m6a_expr_type) %>%...***画在图上了,具体画图方法可以参考 ☞m6a甲基化相关基因boxplot并显示p值 参考资料: ☞统计学数据分析方法汇总!

1.4K51

R可视乎|马赛克图

可以通过这两个变量来检测类别与其子类别之间关系。 主要优点 马赛克图能按行或按列展示多个类别的比较关系。 主要缺点 难以阅读,特别是当含有大量分段时候。...对于非均匀马赛克图,关注数据维度非常多,一般用户很难直观理解,多数情况下可以被拆解成多个不同图表,以下我们会对其进行绘制。...计算出每行最大,最小值,并计算每行各数百分比。ddply()对data.frame分组计算,并利用join()函数进行两个表格连接。...()函数使用自定义统计函数,对data.frame分组计算 dfm1 <- ddply(dfm, ....(Delta,Gamma等)占比情况,从横向来看,不同变量(A,B等)宽度代表该变量占所有数据占比情况,越宽说明该变量数据总和越大。

1.4K20

R语言之可视化(22)绘制堆积条形图

问题描述:搜集患者信息时总是需要统计患者情况分布,或者需要探讨变量之间关系。 ? 比如我们遇到上图数据时,想要知道性别是否于stage有关系?...经过这张图,我们可以初步得到信息是:(1)T1到T4各个分期患者总数(2)T1期男性患者数目,T1女性患者数目(3)其他分期男性或者女性患者数目。...第二步:统计不同stage下,男性和女性患者百分比 library(plyr) data <- ddply(data,'stage',transform,percent = 1/sum(number)...总结 这里我用了两个个小技巧,(1)首先明确ggplot2绘制堆叠条形图时,对number这一列相加,所以我将number设置为1,刚好代表每一行就是一个样本/患者(2)计算百分比时,用了ddply函数...,它首先将stage分组,然后计算stage=T1时,T1样本中男性数目除以T1样本总数目,这样就得到了每一个样本在所属stage百分比,随后绘图相加即可得到百分比图。

5K20

手把手教你画双基因生存曲线

科研芝士小伙伴们你们好啊~前几天看文献时候看到一个双基因联合分组生存曲线图,觉得挺有意思。今天我就以TCGA库乳腺癌(BRCA)为例,教大家怎么画双基因生存曲线~ ?...一、安装和加载所需包 RTCGA是一系列根据数据类型分离包,相当于要先下载这些离线数据R包之后再直接从离线数据包里面获取TCGA所有数据。最新版本可以加载下图所有的包,可谓是非常强大了。 ?...infoTCGA看到各种肿瘤各种数据那是相当丰富。 ? 二、从TCGA数据库上获取乳腺癌 临床数据 ? 至此便获得了乳腺癌临床数据。从图可以看出该数据集一共有1098个样本。 ?...dplyr包是 Hadley Wickham (ggplot2包作者,被称作“一个改变R的人”)杰作,他将原本plyrddply()等函数进一步分离强化,专注接受dataframe对象, 大幅提高了速度...可能小伙伴们也有别的方法,欢迎评论区里留言提出你看法和问题哦~ 后台回复关键词:双基因,领取代码。 如果你有生信需求,也可以联系小编分析哦!

2.5K20

可以不source脚本情况下将变量从Bash脚本导出到环境

echo $VAR 有没有一种方法可以通过只执行 export.bash 而不 source 它获取 $VAR? 答: 不可以。 但是有几种可能解决办法。...调用 shell 上下文中执行脚本: $ cat set-vars1.sh export FOO=BAR $ . set-vars1.sh $ echo $FOO BAR 另一种方法是脚本打印设置环境变量命令.../set-vars2.sh)" $ echo "$FOO" BAR 终端上执行 help export 可以查看 Bash 内置命令 export 帮助文档: # help export export...-f 指 shell 函数 -n 从每个(变量)名称删除 export 属性 -p 显示所有导出变量和函数列表 ---- 参考: stackoverflow question 16618071...help eval 相关阅读: 用和不用export定义变量区别 shell编程$(cmd) 和 `cmd` 之间有什么区别 ----

13520

「R」如何汇总数据

问题 你想要按照组别总结你数据(均值、标准差等等)。 方案 有三种方法描述基于一些特定变量分组数据,然后对每一组使用总结函数(像均值、标准差等等)。...它可以干以下事情: 寻找均值、标准差和计数 寻找均值标准误(强调,如果你处理是被试内变量这可能不是你想要) 寻找95%置信区间(也可以指定其他值) 重命令结果数据集变量名,这样更方便后续处理...有时候总结数据框存在因子组合 - 这意思是,因子组合可能存在,但原始数据框里又没有实际出现。...处理缺失值 如果数据存在NA值,你需要添加na.rm=TRUE选项。通常你可以summaryBy()函数设置,但length()函数识别不了这个选项。...它可以干以下事情: 寻找均值、标准差和计数 寻找均值标准误(强调,如果你处理是被试内变量这可能不是你想要) 寻找95%置信区间(也可以指定其他值) 重命令结果数据集变量名,这样更方便后续处理

2.4K30

cuda核函数可以按地址调用普通变量么?

请问cuda核函数可以按地址调用普通变量么?...但需要注意这个问题: (1)最终指向global memory地址空间指针,可以本次kernel启动,或者下次kernel启动任何线程中都是有效。...如果错误本次kernel启动本block其他线程使用,则自动得到被替换成对应线程对应local memory位置值。...另外两点需要注意: (4)部分平台支持P2P Access情况下,则指向一张卡global memory指针,可以另外一张卡上kernel中被使用,类似情况(1)。...(例如可以参考Pascal具有的显存作为缓存模式(可以看成GPUL3 cache,或者看成GPU支持虚拟内存---例如一张3GB的卡可以使用“虚拟“8GB显存,并且并非所有位置访问概率相同情况下

3.1K70

R语言学习笔记之——数据处理神器data.table

注意以上新建列时,如果只有一列,列名比较自由,写成字符串或者变量可以,但是新建多列,必须严格按照左侧列名为字符串向量,右侧为列表模式,当然你也可以使用第二种写法。...mydata[carrier %in% c("AA","AS"),.N] [1] 26876 .N是一个计数函数,相当于plyrcount,或者基础函数length。...当整列和聚合单值同时输出时,可以支持自动补齐操作。 当聚合函数与data.table分组参数一起使用时,data.table真正威力才逐渐显露。 mydata[,....如果想要运行同时进行输出则可以结尾加上[] setorder(mydata,carrier,-arr_delay)[] ? 这个功能有点儿类似于基础函数语句外部加上圆括号。...左手用R右手Python系列——数据合并与追加 长宽转换: 长宽转换仍然支持plyrmelt/dcast函数以及tidyrgather/spread函数。

3.6K80

10个令人相见恨晚R语言包

plyr 给予你一些函数 (ddply, daply, dlply, adply, ldply)按照常见蓝图:将数据结构分组拆分,对每个组应用一个函数,将结果返回到数据结构。...("plyr")library(plyr)# 按照 Species 拆分数据库,汇总一下,然后转换结果# 到数据框ddply(iris, ....你现在准备R中进行一些分析,因此你可以SQL编辑器运行查询,将结果复制到csv(或者……xlsx)并读入R,你并不需要这样做! R对于几乎每一个可以想到数据库都有好驱动。...不仅可以避免生成数以百计CSV文件,R运行查询还可以节省I/O和转换数据类型时间。日期,时间等会自动设置为R等价表示。...它还使你R脚本可重复,因此你或你团队其他人可以轻松获得相同结果。 6. lubridate R处理日期我从来没有幸运过。我从来没有完全掌握用POSIXs和R内建日期类型合作方法。

1.5K100

让Single cell UMAP注释支棱起来

分享是一种态度 最近在画UMAP时候发现有的时候细胞亚群注释与点重合颜色上不是很搭配,同事提出让注释“支棱”起来,首先想到是ggforcegeom_mark_ellipse,实践遇到一些问题...UMAP_2, label=cluster, col=cluster), inherit.aes = F) + NoLegend() 版本一 非常难看不是?...因为有一些cluster(Naive CD4 T)存在异常值,ggforce函数会包含所有的点。所以应该将异常值去掉,这个方法有很多,我使用是之前用到置信椭圆方法。...::ddply(points, "cluster", aux, one="UMAP_1", two="UMAP_2") DimPlot(pbmc3k.final) + geom_mark_ellipse...## 调整prob参数 ell <- plyr::ddply(points, "cluster", aux, one="UMAP_1", two="UMAP_2", prob=0.1) DimPlot

1.1K20

JS基础测试: jQuery,哪个方法可以解决$变量名冲突问题?​

考核内容: jQuery 核心 - noConflict() 方法 题发散度: ★★★ 试题难度: ★★★ 解题思路: 使用 noConflict() 方法为 jQuery 变量规定新名称: var...jq=$.noConflict(); 定义和用法 1.noConflict() 方法让渡变量 $ jQuery 控制权。...2.该方法释放 jQuery 对 $ 变量控制。 3.该方法也可用于为 jQuery 变量规定新自定义名称。 提示:在其他 JavaScript 库为其函数使用 $ 时,该方法很有用。...说明 许多 JavaScript 库使用 $ 作为函数或变量名,jQuery 也一样。 jQuery ,$ 仅仅是 jQuery 别名,因此即使不使用 $ 也能保证所有功能性。...假如我们需要使用 jQuery 之外另一 JavaScript 库,我们可以通过调用 $.noConflict() 向该库返回控制权: 例如:创建一个新别名用以接下来库中使用 jQuery 对象

2.3K30

业务用例研究组织可以同一个建设系统可以变化

2013-02-08 9:44:15 上孙安俊(359***041) 请问大家一个问题,业务用例研究组织可以同一个建设系统可以变化?...2013-02-08 9:44:51 潘加宇(3504847) 没有必要变化了 2013-02-08 9:46:55 潘加宇(3504847) 这个划定范围,能把你要改进场景被包在里头就可以。...2013-02-08 9:51:42 潘加宇(3504847) 部门就可以了,把这些场景组织到部门用例下面 2013-02-08 9:54:44 潘加宇(3504847) 既然改进范围波及整个部门,...2013-02-08 10:14:41 上李帅(958**7) 意味着缺少了资源 2013-02-08 10:25:47 上孙安俊(359***041) 请假与加班是相对可以进行调休 2013-02...2013-02-08 11:11:15 潘加宇(3504847) 请假本身不是部门用例,但会影响部门某些用例实现,把请假作为一个场景放在这些用例下面。

2.7K30
领券