你好,我需要从这个数据中筛选基因>10读至少2个复制。
PancreasLungDesign
Individual sex age RNA.quality..max10. organ tissue
GTEX-1KXAM-0226-SM-EV7AP GTEX-1KXAM 1 60-69 7.2 Pancreas Pancreas
GTEX-18A67-1726-SM-7KFT9 GTEX-18A67 1 50-59 7.5 Pancreas Pancreas
GTEX-14BMU-0726-SM-73KXS GTEX-14BMU 2 20-29 7.2 Pancreas Pancreas
GTEX-13PVR-0726-SM-5S2PX GTEX-13PVR 2 60-69 7.3 Pancreas Pancreas
GTEX-1211K-1126-SM-5EGGB GTEX-1211K 2 60-69 7.3 Pancreas Pancreas
GTEX-11TT1-0326-SM-5LUAY GTEX-11TT1 1 20-29 7.7 Pancreas Pancreas
GTEX-1KXAM-0426-SM-DHXKG GTEX-1KXAM 1 60-69 9.1 Lung Lung
GTEX-18A67-1126-SM-7KFSB GTEX-18A67 1 50-59 8.5 Lung Lung
GTEX-14BMU-0526-SM-73KW4 GTEX-14BMU 2 20-29 9.2 Lung Lung
GTEX-1211K-0826-SM-5FQUP GTEX-1211K 2 60-69 8.2 Lung Lung
GTEX-11TT1-1626-SM-5EQL7 GTEX-11TT1 1 20-29 8.9 Lung Lung
GTEX-ZYFG-0226-SM-5GIDT GTEX-ZYFG 2 60-69 8.7 Lung Lung counts
GTEX-Y5V6-0526-SM-4VBRV GTEX-1KXAM-1726-SM-D3LAE GTEX-18A67-0826-SM-7KFTI GTEX-14BMU-0226-SM-5S2QA
ENSG00000243485 0 0 0 0
ENSG00000237613 1 0 0 0
ENSG00000186092 2 2 2 0
ENSG00000238009 1 0 0 12
ENSG00000222623 0 0 0 0
ENSG00000241599 0 0 0 0
ENSG00000236601 0 0 0 0
ENSG00000235146 0 0 0 0
ENSG00000223181 0 0 0 0
ENSG00000237491 214 205 164 108
ENSG00000177757 20 40 57 42
ENSG00000225880 214 114 146 149
ENSG00000230368 2 4 2 0
ENSG00000272438 5 2 11 2
ENSG00000230699 27 37 25 23
ENSG00000241180 0 0 0 0
GTEX-13PVR-0626-SM-5S2RC GTEX-1211K-0726-SM-5FQUW GTEX-1KXAM-0926-SM-CXZKA GTEX-18A67-2626-SM-718AD
ENSG00000243485 0 0 2 7
ENSG00000237613 0 0 1 3
ENSG00000186092 0 0 2 7
ENSG00000238009 0 2 2 2
ENSG00000222623 0 0 0 0
ENSG00000241599 0 0 0 1
ENSG00000236601 1 1 0 5
ENSG00000235146 0 0 0 0
ENSG00000223181 0 0 0 0
ENSG00000237491 100 174 99 116
ENSG00000177757 60 73 27 36
ENSG00000225880 126 221 101 97
ENSG00000230368 0 12 6 6
ENSG00000272438 4 0 3 5
ENSG00000230699 32 10 20 24
ENSG00000241180 0 0 0 0我尝试使用这些代码行:
Expressedgenes=counts>10
NumExpressedgenes=apply(Expressedgenes,1,sum)
FilteredCounts=counts[NumExpressedgenes>0,]但以这种方式,这意味着我过滤基因的>10读,但只有一个复制,对吗?我如何过滤至少2?
GTEX-Y5V6-0526-SM-4VBRV GTEX-1KXAM-1726-SM-D3LAE GTEX-18A67-0826-SM-7KFTI GTEX-14BMU-0226-SM-5S2QAENSG00000243485假ENSG00000237613假假ENSG00000186092假假假ENSG00000238009假ENSG00000222623假ENSG00000241599假假假ENSG00000236601假ENSG00000235146假假ENSG00000223181假假假ENSG00000237491真真ENSG00000177757真真ENSG00000225880真真真真ENSG00000230368假假ENSG00000272438假ENSG00000230699真真ENSG00000241180假假
发布于 2022-07-22 16:02:48
如果至少需要两列为真,则使用rowSums创建逻辑向量
i1 <- rowSums(counts>10, na.rm = TRUE) > 1
counts[i1,]https://stackoverflow.com/questions/73082868
复制相似问题