Solr
Solr是一个可扩展的,可部署,搜索,存储引擎,优化搜索大量以文本为中心的数据库
Solr是开源搜索平台,用于构建搜索应用程序
建立在Lucene(全文搜索引擎)之上
Solr是企业级的,...有助于在网上定位信息
用户可以通过以关键字或短语的形式将查询传递到搜索引擎中来搜索信息,然后搜索引擎搜索其数据库并向用户返回相关链接
搜索引擎组件
搜索引擎有三个组件:
Web爬虫: 一个收集网络信息的软件组件....索引类似于在书开始页或末尾处的目录索引,其中常见单词以页码显示,使得这些单词可以快速追踪,而不是搜索整本书
用于搜索的用户接口: 当索引数据库就绪,应用程序就可以执行搜索操作.为了帮助用户进行搜索,应用必须提供用户接口...渲染结果: 当收到所需结果,应用程序应决定如何使用用户界面向用户显示搜索结果
分词技术
分词技术: 搜索引擎针对用户提交查询的关键词串进行的查询处理后,根据用户的关键词串用各种匹配方法进行分词的一种技术...基于Java语言开发的轻量级中文分词工具包
基于文本匹配,不需要投入大量的人力进行训练和标注
可以自定词典,方便加入特定领域的词语,能分出多粒度的结果
部署Solr并安装IKAnalyzer
创建/usr