/usr/share/dict/words
包含了很多单词。这个列表是如何生成的?它的内容在不同的组合中是否相同?有什么标准规定它必须包含什么吗?
到目前为止,我所能看到的只是Ubuntu/Debian上的列表来自于字表包,但是它们的描述并没有提供列表是如何实际生成的线索。
发布于 2016-01-05 21:58:54
你问了很多问题,但我认为主要的问题是:
有什么标准规定它必须包含什么吗?
据我所知没有。
既然如此,你的相关问题:
这个列表是如何生成的?它的内容在不同的组合中是否相同?
答案是“它取决于每个不同的Unix”。
将单词列表作为操作系统的一部分的约定来自于这个spell(1)
实用程序,它将其用于原始拼写检查过程。
这一拼写检查程序在学术论文“拼写列表的开发”,贝尔实验室的M.D.McIlroy,1982年年中作了描述。
您应该检查操作系统的包管理器,以了解拼写列表的来源、生成的方式以及可用的替代方案。
例如,在Debian GNU+Linux上:
/usr/share/dict/words
文件是使用Debian“alternatives”系统管理的符号链接。wamerican
包。wamerican
的包文档声明其word列表来自面向拼写检查的单词列表项目。还可以安装许多其他word列表包;它们都有“Provides:wordlist”字段:
$ aptitude search '?provides(wordlist)' | wc -l
34
在不同的组合中,您需要查看包系统和文档,以了解单词列表的出处和替代方案。
https://unix.stackexchange.com/questions/213628
复制相似问题