首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言】因子临床分组的应用

前面给大家简单介绍了 ☞【R语言】R的因子(factor) 今天我们来结合具体的例子给大家讲解一下因子临床分组的应用。 我们还是以TCGA数据的CHOL(胆管癌)这套数据为例。...关于这套临床数据的下载可以参考 ☞如何从TCGA数据库下载RNAseq数据以及临床信息(一) 前面我们也给大家介绍过一些处理临床数据的小技巧 ☞【R语言】卡方检验和Fisher精确检验,复现临床paper...☞R生成临床信息统计表 ☞玩转TCGA临床信息 ☞TCGAbiolinks获取癌症临床信息 接下来我们先读入临床数据 #读取临床数据 clin=read.table("clinical.tsv...*","stage I/II",stage) #转换成因子 stage=factor(stage) stage 可以得到下面这个两分组的因子 方法二、直接使用factor函数 #删除组织病理学分期末尾的...】R的因子(factor) ☞如何从TCGA数据库下载RNAseq数据以及临床信息(一) ☞【R语言】卡方检验和Fisher精确检验,复现临床paper ☞R生成临床信息统计表 ☞玩转TCGA临床信息

3.2K21
您找到你想要的搜索结果了吗?
是的
没有找到

Excel公式技巧67:条件将数据分组标识

学习Excel技术,关注微信公众号: excelperfect 如下图1所示的工作表,我们想使用数字将数据分成几组,其标准是:第1次出现笔记本且区域A至第2次出现笔记本且区域A之间的数据为第1组,标识为...1;第2次出现笔记本且区域A至第3次出现笔记本且区域A之间的数据为第2组,标识为2,依此类推。...图1 单元格E3输入公式: =SUM(E2,AND(B3:B20=G3,C3:C20=H3)) 向下拉至单元格E20,结果如上图1所示。...在上图1所示的工作表,单元格E3和E4返回的结果都为0,单元格E5,由于满足条件,因此AND函数返回TRUE(1),将其与上方单元格E4的值相加,得到结果1。...小结:本文所讲述的技巧可用于构造辅助列,从而方便实现重复数据的查找。 欢迎在下面留言,完善本文内容,让更多的人学到更完美的知识。

3.4K30

R语言】数据两列排序

我相信大家经常会使用Excel对数据进行排序。有时候我们会按照两个条件来对数据排序。假设我们手上有下面这套数据,9个人,第二列(score)为他们的考试成绩,第三列(code)为对应的评级。...Excel里面其实还是很容已实现的。我们只需要先根据code来进行升序排序,然后次要关键字再根据分数进行降序排序。 我们就会得到如下结果 那么这个过程怎么R里面实现呢?...主要用的是R的order这个函数。...#读入文件,data.txt存放的数据为以上表格展示的数据 file=read.table(file="data.txt",header=T,sep="\t") #先按照code升序,再按照Score...只需要前面加个负号就可以了 View(file[order(file$Code,-file$Score),]) 下面是按照code升序,然后再按score降序排列的结果,是不是跟Excel处理的结果一样 R

2.2K20

Ubuntu实现pythontab

---- 1.问题引出:默认情况下python交互界面的tab键         linux下,或在路由器、交换机上,tab键得很爽,什么不完整的,tab一下都出来了,无奈,linux安装的python...,默认情况是没有tab功能的,也就是python的交互界面,tab是没有办法补全的,python的交互界面只是把它当作正常的多个空格补全来处理: xpleaf@py:~/seminar6/day1$...=====>tab键,想看看sys的子模块,结果就是出了一大堆空格键 是啊,这也太恶心了!没有tab键,宝宝不开心!...不过当时确实找了好多,都找不到一个我自己的实验环境可以使用的,总是提示各种错误!还好,总算让我找到一个可以使用的,下面直接给出tab.py的代码: #!...$ sudo mv tab.py /usr/lib/python2.7/ xpleaf@py:~/seminar6/day1$ ll /usr/lib/python2.7/tab.py -rw-rw-r-

1.5K20

Python路径读取数据文件的几种方式

img 其中test_1是一个包,util.py里面想导入同一个包里面的read.py的read函数,那么代码可以写为: from .read import read def util():...此时read.py文件的内容如下: def read(): print('阅读文件') 通过包外面的main.py运行代码,运行效果如下图所示: ?...img 现在,我们增加一个数据文件,data.txt,它的内容如下图所示: ? img 并且想通过read.py去读取这个数据文件并打印出来。...这是因为并不是所有数据文件都是字符串,如果某些数据文件是二进制文件或者图片,那么以字符串方式打开就会导致报错。...此时如果要在teat_1包的read.py读取data2.txt的内容,那么只需要修改pkgutil.get_data的第一个参数为test_2和数据文件的名字即可,运行效果如下图所示: ?

19.9K20

能不能让R行处理数据

这些问题都是在平日的工作中有很高可能性出现并且看似容易实则让人抓狂的问题,Stackoverflow上他们有着很高的人气。事实上,这些问题也就是你“看懂一本R的教材”和“成为R大神”之间的距离。...如果要自己寻找Stackoverflow上与R或是data.table相关的问题,可以搜索栏输入[R] [data.table] Your question。 提 出问题 好啦,开始上课!...解 题思路 解决本问题的过程我们需要用到data.table包!...我们只要把数据按照fund_name分组,然后对每组求scale的均值。唯一需要注意的有两点。首先,别忘了mean的na.rm = T参数,它能够让函数忽略缺失值。...本 期总结 本期大猫带领大家学习了如何在R按照行进行处理。R数据处理哲学是向量,是列,但这并不妨碍我们按照行进行处理,其中的关键,就在于运用 c() 函数把不同的向量拼接成一个向量。

1.3K20

R语言︱数据分组统计函数族——apply族用法与心得

笔者寄语:apply族功能强大,实用,可以代替很多循环语句,R语言中不要轻易使用循环语句。...函数名 功能 特点 apply 行、列运算均值、求和、众数等 简单运算 tapply=table apply apply之上加入table功能,可以分组汇总 table结合,可以分组汇总 lapply...tapply(1:4, fac, sum) 1 2 3 4 5 5 2 3 NA NA #当index不是因子时,可以用as.factor()把参数强制转换成因子 额外案例,实现excel数据透视表的功能...vapply函数总是会进行简化,vapply会检测FUN的所有值是否与FUN.VALUE兼容, 以使他们具有相同的长度和类型。...输入应该单列,或者List格式的,整个多字节的数据框是不对的; 输出也只能是某一种形式,可以保存到list的,比如此时的字符形式。 ———————————————————————————

3.3K30
领券