Solr
Solr是一个可扩展的,可部署,搜索,存储引擎,优化搜索大量以文本为中心的数据库
Solr是开源搜索平台,用于构建搜索应用程序
建立在Lucene(全文搜索引擎)之上
Solr是企业级的,...的所有功能
RESTful API: 要与Solr通信,可以使用RESTful服务与Solr通信,可以使用XML,JSON,CSV等格式的文件作为输入文档,并以相同的文件格式获取结果
全文搜索: Solr...数据库: Web上的所有信息都存储在数据库中,包含大量的Web资源
搜索接口: 这个组件是用户和数据库之间的接口,帮助用户搜索数据库
搜索引擎工作流程
获取原始内容: 任何搜索应用程序的第一步是收集要进行搜索的目标内容...中文分词算法
基于字符串匹配
基于字符串匹配:
即扫描字符串,如果发现字符串的子串和词相同,就算匹配
这类分词通常会加入一些启发式规则:正向/反向最大匹配,长词优先等
基于字符串匹配算法优点:
速度快.../solrdata:/opt/solrdata
Dockerfile(在/usr/local/docker/solr/ikanalyzer中需要有文件:ik-analyzer-solr5-5.x.jar