我有一个以制表符分隔的大型数据库,如下所示:
1 14933 14933 G A ID=COSN404397;OCCURENCE=1(lung)
1 14948 14948 G A ID=COSN415697,COSN415698;OCCURENCE=2(urinary_tract)
1 69537 69537 G T ID=COSM536198;OCCURENCE=1(lung)
1 69538 69538 G A ID=COSM75742;OCCURENCE=1(ovary)
...我正在尝试使用awk或grep来仅保留>=为3的行(是的,它在整个数据库中都拼写错误!),但我似乎找不出最好的方法来拆分/扫描第6列……
发布于 2013-04-10 01:04:51
这段简短的一行代码应该对您有效。顺便说一句,您当前的示例没有任何包含OCCURENCE>=3 :)的行。)
awk -F'OCCURENCE=|\\(' '$2>=3' file好吧..。如果你会打高尔夫球...(=是关键...:D
awk -F'[(=]' '$3>2' filehttps://stackoverflow.com/questions/15907913
复制相似问题