首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >查找和计数文本文件中重复字符串的软件

查找和计数文本文件中重复字符串的软件
EN

Software Recommendation用户
提问于 2022-04-22 16:35:17
回答 2查看 211关注 0票数 0

我正在寻找关于Windows工具的建议,以便在包含50万至999行的文本文件中查找和计数重复行。

该工具可以是CLI或GUI。

如果重复行为连续行或非连续行,则需要将其计算为重复行。

例如,如果我们有以下文本文件:

代码语言:javascript
运行
复制
I am a lizard.
I am a dog.
I am a cat.
I am a bird.
I am a lizard.
I am a lizard.
I am a dog.
I am a cat.
I am a dog.
I am a lizard.

输出将类似于:

代码语言:javascript
运行
复制
I am a lizard. (4)
I am a dog. (3)
I am a cat. (2)

只要我能够从输出中确定副本(以及每个副本的数量),输出的确切格式就不重要了。

需求:

  • 免费的。
  • Windows-兼容性。

加值功能(不需要):

  • 与Linux的交叉兼容性。
  • 便携式软件(没有安装程序)是一个很大的优势。
  • 能够设置被归类为重复的事件行的最小数量。
  • 只能找到与正则表达式(正则表达式)匹配的字符串。这并不重要,因为我可以用regex工具预处理每个文件。
  • 软件一次只需要处理一个文件。虽然我有多个文件要处理,但目前不需要跨文件查找重复文件。如果该工具可以将多个文件作为输入处理,这是一个额外的好处,但不是必需的。
EN

回答 2

Software Recommendation用户

发布于 2022-04-22 21:45:32

我相信清晰的文本编辑器可以做到这一点。https://crisp.com是我见过的最全面的文本编辑器。

不是免费的(商业代码),但是有windows和linux,我相信mac版本。

我认为,如果您找到了一个编辑器,它可以读取具有全面(多列)排序功能的文件,那么您就可以对大文件进行排序,然后手动计数dups。如果你有一个大文件,这是可以的,但如果你必须做很多单独的文件,可能会变得乏味。一次不花多少钱就可以了。

票数 0
EN

Software Recommendation用户

发布于 2022-05-18 03:52:33

这个免费的网站看起来像在做你想要的:https://www.somacon.com/p568.php

它在技术上不是可下载的软件,但它当然也能在Linux上工作。

票数 0
EN
页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwarerecs.stackexchange.com/questions/82816

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档