我有一个包含所有外显子和外显子所属基因的数据框架。当前的外显子名称并不代表它们的顺序。我已经根据起始基因组位置对它们进行了排序,所以现在我只需要生成一个列,根据基因给它们一个序号。
数据帧顶部的示例:
基因外显子
GENE1,"789",
GENE1,"953",
GENE1,"102",
GENE2,"43024",
GENE3,"542",
GENE3,"047",
这就是我想要的数据框的样子:
基因外显子基因组序列
GENE1,"789",1
GENE1,"953",2
GENE1,"102",3
GENE2,"43024",1
GENE3,"542",1
GENE3,"047",2
如何创建一个根据另一个向量的标识对行进行顺序排序的列。
发布于 2021-05-01 06:22:57
您可以使用ave尝试下面的代码
transform(df, Order = ave(1:nrow(df),GENE,FUN = seq_along))发布于 2021-05-01 07:32:12
在data.table中
library(data.table)
setDT(df)[, Order := rowid(GENE)]https://stackoverflow.com/questions/67341053
复制相似问题