我正在寻找关于Windows工具的建议,以便在包含50万至999行的文本文件中查找和计数重复行。
该工具可以是CLI或GUI。
如果重复行为连续行或非连续行,则需要将其计算为重复行。
例如,如果我们有以下文本文件:
I am a lizard.
I am a dog.
I am a cat.
I am a bird.
I am a lizard.
I am a lizard.
I am a dog.
I am a cat.
I am a dog.
I am a lizard.
输出将类似于:
I am a lizard. (4)
I am a dog. (3)
I am a cat. (2)
只要我能够从输出中确定副本(以及每个副本的数量),输出的确切格式就不重要了。
发布于 2022-04-22 21:45:32
我相信清晰的文本编辑器可以做到这一点。https://crisp.com是我见过的最全面的文本编辑器。
不是免费的(商业代码),但是有windows和linux,我相信mac版本。
我认为,如果您找到了一个编辑器,它可以读取具有全面(多列)排序功能的文件,那么您就可以对大文件进行排序,然后手动计数dups。如果你有一个大文件,这是可以的,但如果你必须做很多单独的文件,可能会变得乏味。一次不花多少钱就可以了。
发布于 2022-05-18 03:52:33
这个免费的网站看起来像在做你想要的:https://www.somacon.com/p568.php
它在技术上不是可下载的软件,但它当然也能在Linux上工作。
https://softwarerecs.stackexchange.com/questions/82816
复制相似问题