问如何从文本文件中显示最常见的单词，并按字母顺序显示同样常见的单词
EN

Unix & Linux用户

提问于 2021-08-10 11:09:22

回答 1查看 197关注 0票数 1

到目前为止，我已经非常接近了，脚本将对单词进行排序，并显示出最常见到最不常见的单词，然而，当这些单词同样常见时，它们需要排序。

cat > file.txt
tr -c '[:alpha:]' '[\n*]' < file.txt |
  sed -r '/^.{,5}$/d' | sort | uniq -c | sort -nr | head -20 | cut -c 9-

任何想法都非常感谢！

发布于 2021-08-10 16:26:17

对于GNU sort或兼容，您可以为第二类使用-s选项，以避免重新排序具有相同数值的行：

... | sort | uniq -c | sort -rns

(请注意，默认情况下，NetBSD实现sort是这样做的)。

票数 2

页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://unix.stackexchange.com/questions/664081

复制

相似问题

问如何从文本文件中显示最常见的单词，并按字母顺序显示同样常见的单词EN