首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

「R」TCGA barcode(样本ID)以及重名过滤

TCGA barcode 接触和分析过TCGA数据的朋友肯定会经常处理TCGA barcode的前15位(有时12位),实际从上图可以看出TCGA的barcode设计总共有28位之多。...每一个短横杠衔接的都是含不同意义的序列,如下图 Create Barcode 具体的解释如下表: Label Identifier for Value Value Description Possible...这也就导致在实际的分析中有可能会出现多个barcode对应同一个样本(即前15位是一致的),那么分析的时候用哪个呢?...通过谷歌引擎找到Biostars上有人对这个问题加以讨论,我按照着提供的链接找到了Broad研究所进行barcode去重的策略: 主要内容如下: In many instances there is more...with the highest portion and/or plate number is selected when all other barcode fields are identical

2K20
领券