我正在创建一个node.js程序,它通过日志文件进行扫描并将信息输出到控制台。
有时,日志文件可能包含错误,这些错误基本上可以永远重复(我说的次数大概是20000次)。
我需要一种方法来检查是否有任何部分的文本在文件中重复多次。
因为我不知道我要找的是什么文本,所以我不能使用原生JS函数、regex或类似的东西。
有人知道我如何不用机器学习就能做到这一点吗?
我还没有尝试任何东西,因为我完全不知道如何做到这一点。
发布于 2020-01-09 07:38:35
将问题分解成多个步骤。一步一步地处理。因此,对于第一步,您的任务是弄清楚如何将文件从磁盘读入变量。下一步:将该变量转换为数组。等。
您可以使用这样的算法:
最后,您将拥有一个仅由唯一日志条目组成的输出数组。把它写成一个文件。
https://stackoverflow.com/questions/59667098
复制相似问题