bash、awk、sed删除具有重复ID的XML块，保持最新，保持原始顺序

、、、

我将感谢任何人在这个脚本任务上的帮助。必须保留输入的原始排序顺序。输入：<TABLES> <ID

浏览 0提问于2016-08-31得票数 0

回答已采纳

4回答

从XML文件中删除特定的重复行

、、、、

我一直在读关于删除堆栈中重复行的文章。有perl、awk和sed解决方案，但是没有一个像我想要的那么具体，我很困惑。我想使用一个快速的bash/ <path>命令来不敏感地删除这个XML中重复的<path>标记。保持所有其他重复行(如<start>和<end>)完好无损！输入XML

浏览 8提问于2016-04-20得票数 3

回答已采纳

4回答

删除xml文件中不带排序或唯一的重复连续行

、、、、

我有一个xml文件，其中我需要保持标记的顺序，但有一个名为media的标记，它具有连续顺序中的重复行。我想删除一个重复的媒体标签，但想保留所有的父标签-(它们也是连续和重复的)。我想知道是否有一个awk解决方案，只有当一个模式匹配时才能删除。duplicate, want to delete this &

浏览 0提问于2015-01-07得票数 4

3回答

sed:如果与模式匹配，则打印分隔行块

、、

我希望使用sed来匹配模式1/ pattern3 2分隔的行块，然后只在包含的块上执行操作(例如打印块)。{H;d};H;x;/catch me if you can/p}}' (其思想是匹配由{和}分隔的块，然后将每个块累加到保持空间中；在每个块的末尾，交换保持空间并执行匹配“如果可以”)。这不起作用，因为所有匹配

浏览 6提问于2016-05-20得票数 6

回答已采纳

4回答

删除第一列被复制的行

、、、、

我有一个文件，其中字符串由一个特殊的字符串(不是逗号或分隔符)分隔，例如。我想检查第一个字段中的所有字符串是否都是唯一的。如果找到相同字段的重复行，则希望删除任何重复行(保留第一个匹配项)。示例：xxxyyyzzz111222333aaabbbccc111222333 我们删除了aaanewnew2，因为aaa我不喜欢我们awk，除非这是唯一的</

浏览 0提问于2019-04-19得票数 0

回答已采纳

1回答

如何从fasta文件中删除重复项，但根据标头保留每个组至少一个

、

CGCTTCAACGGAATGGATCTACGTTACAGCCTGCATAAAGAAAACGGAGTTGCCGAGGACGAAAGCGACTTTAGGTTCTGTCCGTTGTCTTTGGCGGAAA 我需要移除副本，但至少要保持每个谱系的顺序因此，在这个简单的示例(注意，samplenameA、C和D是相同的)中，我只想删除samplenameD或samplenameC，而不是两者都删除。最后，我希望获得与原始文件相同的头信息。CG

浏览 1提问于2020-07-25得票数 3

回答已采纳

4回答

BASH/sed用于从文本文件中逐行分隔的单词列表中删除重复项。

、、

我有一个很长的词汇表，每行一个单词。有时，有一个重复的词，出现不止一次或两次。我需要一个简单的代码，它将保留一个单词的第一次出现，但删除它之后的所有重复项(及其行)。我不想删除任何特殊字符或重排任何东西，只删除单词(每行一个)。保持相同的语序是很重要的。不管它是覆盖原始文件还是保存到一个新的文件，无论哪个是“更有效”。这是

浏览 1提问于2018-10-24得票数 0

回答已采纳

5回答

bash、sed、awk删除块中具有重复ID和较旧日期的文本块

、、

我想删除除具有最新日期的区块之外的所有具有非唯一ID的区块。我希望这些例子能说明问题。任何awk和/或sed解决方案都将不胜感激！原始文件： <BLOCK>TextDATE=20160101</BLOCK> TextID=2000 DA

浏览 30提问于2016-08-29得票数 1

回答已采纳

3回答

按最后一个字段排序并打印整行

、、

我正在尝试使用awk和sort按姓氏对名称文件进行排序。有些人没有中间名。下面是一个例子：Chandler M BingPhoebe BuffayJoey F Tribbiani awk -F " " '{print $NF, $0}' names.txt | sortBing Chandler M BingGeller任何反馈都是值

浏览 0提问于2018-02-28得票数 0

6回答

TSV:如果字段1是重复的，如何连接字段2s

、、、、

我正在为ANKI构建一个瑞典英语句子套，它来自tatoeba.org的。请帮助我把样品1转到样本2(最好是在bash)：a 1b 3c 5 a 1<br>2c 4<br>5 字段1中的重复总是后继的。

浏览 11提问于2014-05-18得票数 1

回答已采纳

6回答

如何找到每一行输入的唯一字符？

、、、

有任何方法来提取每一行的独特字符吗？sort -u file 我想确定每一行的唯一字符(类似于每一行的sort -u )。

浏览 15提问于2015-08-21得票数 8

回答已采纳

3回答

带数组的Bash函数不能工作

、、

我正在尝试用bash编写一个函数，但它无法工作。该函数如下所示，它以以下格式获得一个文件：4 5 second 6 ...我试图只访问每一行第三个单词中的字符串，并用它们填充数组"arr“，而不重复相同的字符串。当我在for循环之后激活"echo“命令时，它在每次迭代中只打印第一个字符串(在上面的”first“中)。

浏览 1提问于2015-04-05得票数 0

回答已采纳

4回答

如何从文件中删除文本块

、、

编辑:在OS 中执行之前没有提到过<element> <subElement name="leaveme"/> <subElementsubElement name="leaveme"

浏览 3提问于2014-07-19得票数 1

回答已采纳

1回答

Bash/awk:基于两列查找重复项，根据其他列中的值保留行

、

我之前的问题()变得更复杂了。 I需要识别逗号分隔的文本文件中的重复条目，基于代表4:标识符、5:日期的列4和5的组合。这两列可以简单地连接起来。如果存在重复项，则需要根据另一列的子字符串(表示int值)执行检查。应保留具有较高价值的副本。创建子字符串的示例：cut -d"," -f14 file.txt | grep -o "N0[0-9]{3}" | <e

浏览 6提问于2020-09-29得票数 0

2回答

在unix系统中的文本文件中找到类似的行

我有一个名为tt.txt的文件，该文件的内容如下：jhds我正在尝试获取与文本文件中的输出类似的行。我的预期产出是：fdgsuniq -u tt.txt > output.txtfdgsfdgs 你知道怎么修吗？

浏览 0提问于2019-05-25得票数 0

回答已采纳

2回答

将多个.bash_history文件与时间戳合并

、

我通过切换VM上的快照生成了多个.bash_history文件。我希望将所有这些文件恢复到当前运行的实例中的单个活动.bash_history文件中。#1542817796set +xcd w/Edge-Agent/edge-agent-ged/set -xmake ack npq &

浏览 0提问于2018-12-04得票数 2

回答已采纳

4回答

在unix中按编号打印所选行

、、、、

我可以将行的范围(118到122)打印为：但是如何在unix中打印188、144和154行(以相同的顺序)呢？

浏览 0提问于2020-07-01得票数 0

1回答

获得具有匹配字符串的唯一行

、、、

我有一个类似JSON的文本文件，其中包含重复的ids，如下所示：{"ID":"21" , "ST":[43,4]}{"ID":"77" , "ST":[87]}

浏览 0提问于2015-06-20得票数 1

3回答

使用sed移除文件的中部

我希望使用sed作为管道的一部分，只保留它输入的10行第一行和最后10行。它不会处理物理文件，而只是从STDIN读取并输出到STDOUT。如果它可以显示一行而不是它删除的所有中间部分，那么额外的奖励：135 6yes ' ' | head -n 100000

浏览 5提问于2016-04-11得票数 2

回答已采纳

6回答

有没有一种合理的方法将新路径附加到bashrc中的路径？

、、

我经常需要将新路径附加到.bashrc中的PATH环境变量，如下所示: export PATH=/usr/local/bin:$PATH然后为了使其生效，我总是执行'source ~/.bashrc‘或~/.bashrc'，虽然我发现这样做的一个缺点是让我不舒服。如果我一直这样做，路径会变得越来越长，有很多重复的条目，例如在前面的命令中，如果我源它两次，路径的值将是PATH=/usr/local/bin:&

浏览 2提问于2010-05-14得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

从XML文件中删除特定的重复行

删除xml文件中不带排序或唯一的重复连续行

sed:如果与模式匹配，则打印分隔行块

删除第一列被复制的行

如何从fasta文件中删除重复项，但根据标头保留每个组至少一个

BASH/sed用于从文本文件中逐行分隔的单词列表中删除重复项。

bash、sed、awk删除块中具有重复ID和较旧日期的文本块

按最后一个字段排序并打印整行

TSV:如果字段1是重复的，如何连接字段2s

如何找到每一行输入的唯一字符？

带数组的Bash函数不能工作

如何从文件中删除文本块

Bash/awk:基于两列查找重复项，根据其他列中的值保留行

在unix系统中的文本文件中找到类似的行

将多个.bash_history文件与时间戳合并

在unix中按编号打印所选行

获得具有匹配字符串的唯一行

使用sed移除文件的中部

有没有一种合理的方法将新路径附加到bashrc中的路径？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐