到目前为止,我已经非常接近了,脚本将对单词进行排序,并显示出最常见到最不常见的单词,然而,当这些单词同样常见时,它们需要排序。
cat > file.txt
tr -c '[:alpha:]' '[\n*]' < file.txt |
sed -r '/^.{,5}$/d' | sort | uniq -c | sort -nr | head -20 | cut -c 9-
任何想法都非常感谢!
发布于 2021-08-10 16:26:17
对于GNU sort
或兼容,您可以为第二类使用-s
选项,以避免重新排序具有相同数值的行:
... | sort | uniq -c | sort -rns
(请注意,默认情况下,NetBSD实现sort
是这样做的)。
https://unix.stackexchange.com/questions/664081
复制相似问题