专栏首页生信技能树按照列筛选数据框不容易那么按照行就容易吗

按照列筛选数据框不容易那么按照行就容易吗

开始正式教程分享之前,先公布一个好消息,腾讯云的排行榜显示我们生信技能树是平台全国排名第123位有影响力的自媒体,还有一个证书:

前面我出过一个考题,是对GEO数据集的样本临床信息,根据列进行筛选,比如:

rm(list=ls())
options(stringsAsFactors = F)
library(GEOquery)
eset=getGEO('GSE102349',getGPL = F)
pd=pData(eset[[1]])

就会下载一个表达矩阵,有113个病人(行),记录了57个临床信息(列),很明显,有一些临床信息列是后续的数据分析里面(主要是分组)没有意义的,病人总共时间日期,所有的病人可能都是一样的。

那么就需要去除,一个简单的按照列进行循环判断即可!

pd=pd[,apply(pd,2,function(x){
  length(unique(x))>1
})]

但是,仔细看临床信息表格会发现,还是有问题:

就是仍然是需要去除无效行,就是去掉临床信息为N/A、Unknown、Not evaluated的行,需要检查全部的列哦~

给一个参考答案

pd=pd[apply(
  apply(pd,2,function(x){
  grepl('N/A',x)
}),1,sum)==0,]

本文分享自微信公众号 - 生信技能树(biotrainee),作者:生信技能树

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-01-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 听说aspera下载会失败,我也解决不了啊

    其实就是解析url规律,然后构建上面的命令,需要替换的仅仅是 SRR5907429

    生信技能树
  • 你打boss我捡宝贝可好-向R包作者致敬(R包安装)

    http://www.ituring.com.cn/article/273090

    生信技能树
  • 批量安装R包小技巧大放送

    实际上,大家即使是没有学习过R包安装,也可以看得懂,变化R包名字,就可以一行行运行代码来安装指定的包了!

    生信技能树
  • [设计模式]之二:策略模式

    也很简单,同一个方法,把折扣作为一个参数,默认值为1,代码改为“单价 数量 折扣”即可。

    wOw
  • TF2.0-结构化数据建模流程范例

    尽管TensorFlow设计上足够灵活,可以用于进行各种复杂的数值计算。但通常人们使用TensorFlow来实现机器学习模型,尤其常用于实现神经网络模型。

    石晓文
  • 7大维度看国外企业为啥选择gRPC打造高性能微服务

    gRPC是一个高性能、开源、通用的RPC框架,面向移动和HTTP/2设计,是由谷歌发布的首款基于Protocol Buffers的RPC框架。

    Debian社区
  • MySQL中 slave_compressed_protocol=ON 的压缩效果实验

    set global slave_compressed_protocol = ON ;

    二狗不要跑
  • SQLiv:一款批量SQL注入漏洞扫描工具

    今天给大家介绍一款名叫SQLiv的批量SQL注入漏洞扫描工具。 功能介绍 批量域名扫描SQL注入漏洞; 扫描指定域名(带爬虫功能); 反向域名扫描; SQL注...

    FB客服
  • EasyNVR H5无插件直播方案前端构建之:videojs初始化的一些样式处理

    由于不同项目的需要,对于加载出来的videojs播放器样式也有不同的需求;我们需要自主的处理一下加载出来的videojs播放器的样式;

    EasyNVR
  • 爬取《悲伤逆流成河》猫眼信息 | 郭敬明五年电影最动人之作

    知道《悲伤逆流成河》上映还是在qq空间看见学弟发了说说,突然想起初中追小四的书,每天看到晚上10点多,昨天看了枪版的《悲伤逆流成河》,整个故事情节几乎和小说一模...

    sergiojune

扫码关注云+社区

领取腾讯云代金券