我正在开发一个Django网站,关于搜索引擎我有以下选择:
选择标准:
有什么好的建议?
注:对于用户实时输入的数据,希望延迟不超过15-30分钟
发布于 2018-02-07 07:26:10
我现在看到的是PostgreSQL全文搜索,它具有现代搜索引擎的所有功能,非常好的扩展字符和多语言支持,与数据库中的文本字段紧密集成。
但它没有像+或(使用& | !)这样的用户友好的搜索操作,而且我也不喜欢它在他们的文档网站上的工作方式。虽然它在结果片段中添加了匹配项,但是匹配项的默认算法并不好。另外,如果你想索引rtf, PDF, MS Office,则需要文件格式转换器。
它比MySQL文本搜索要好得多,它甚至不包括三个字母或更少的单词。
Lucene/Solr和Sphinx都很棒。
对于Shaili-Solr来说,它包括Lucene搜索代码库,并且拥有一个不错的独立搜索引擎的组件。
https://stackoverflow.com/questions/-100003172
复制相似问题