我正在开发一个Django网站,关于搜索引擎我有以下选择:

  • Lucene/Lucene with Compass/Solr
  • Sphinx
  • PostgreSQL
  • MySQL

选择标准:

  • 通过结果相关性排序
  • 检索速度
  • 易于使用,易于与Django集成
  • 资源需求:站点将托管在VPS,因此理想情况下,搜索引擎不需要大量的RAM和CPU。
  • 可伸缩性
  • 额外的功能,相关搜索

有什么好的建议?

注:对于用户实时输入的数据,希望延迟不超过15-30分钟

pyjplpyjpl提问于
黄易音乐战组程序员回答于
已采纳

关于Sphinx。

  • 可以自定义排序方式
  • 索引速度非常快,因为它直接与数据库进行数据交互。
  • 有一个Python的API可以与Sphinx直接使用
  • 搜索服务的守护进程(Searchd)的内存使用量非常低,你也可以设置这个内存使用量
  • 我对它的可伸缩性不是很了解。,它在高负载下非常好,所以在多台机器上扩展应该也是非常方便的。
  • Sphinx在使用字典的时候会使用词干,例如,在搜索时,“driving”和“drive”会被认为是相同的。
  • 但是Sphinx不允许对字段数据进行部分索引更新。

我还不是很清楚MySQL的全文搜索,与其他的性能差异。

回答过的其他问题

在CentOS服务器中我看不到任何jenkins文件中的任何Java配置。有什么主意吗?

如果你去/etc/init.d/打开jenkins文件,你会发现: candidates=" /etc/alternatives/java /usr/lib/jvm/java-1.6.0/bin/java /usr/lib/jvm/jre-1.6.0/bin/java /usr...... 展开详请

如何在Windows中手动生成SSH密钥?

您也可以使用终端应用程序通过macOS生成SSH密钥。上传有效的公共SSH密钥后,Triton计算服务使用SmartLogin将公钥复制到您配置的任何新SmartMachine。 关于终端 终端是终端仿真器,它为macOS的Unix shell提供基于文本的命令行界面。 要打开m...... 展开详请

自然场景文字识别技术及在地图中的应用

地图自然场景文字识别技术

      地图众包图片具有多方向性,几何畸变,图像退化,及图片中文字的排版复杂,尺度多样等特性

第三方做的免费小程序要购买服务器吗?

这个看你业务需求了 如果需要后端交互 那就需要买服务器的

有一站式抓娃娃机解决方案?

redis认证失败怎么办?

推荐
如下图:[图片描述]原因:目前主从版redis在linux客户端下支持2种格式的连接方式 • 格式1,“实例id:密码”的格式类型,例如您的实例id是crs-bkuza6i3,设置的密码是abcd1234,则连接命令如下 redis-cli -h IP地址 -p 端口 -a cr...... 展开详请

扫码关注云+社区