的所有功能
RESTful API: 要与Solr通信,可以使用RESTful服务与Solr通信,可以使用XML,JSON,CSV等格式的文件作为输入文档,并以相同的文件格式获取结果
全文搜索: Solr...提供了全文搜索所需的所有功能:令牌,短语,拼写检查,通配符,自动完成
企业准备: 根据企业或组织的需要,Solr可以部署在任何类型的系统:独立,分布式,云
灵活可扩展: 通过扩展Java类并进行相关配置...渲染结果: 当收到所需结果,应用程序应决定如何使用用户界面向用户显示搜索结果
分词技术
分词技术: 搜索引擎针对用户提交查询的关键词串进行的查询处理后,根据用户的关键词串用各种匹配方法进行分词的一种技术...即根据观测到的数据(标注好的语料)对模型参数进行估计.即 训练
在分词阶段再通过模型计算各种分词出现的概率,将概率最大的分词结果作为最终结果
常见的序列标注模型:HMM,CRF
基于统计及机器学习的分词方式优点...Java语言开发的轻量级中文分词工具包
基于文本匹配,不需要投入大量的人力进行训练和标注
可以自定词典,方便加入特定领域的词语,能分出多粒度的结果
部署Solr并安装IKAnalyzer
创建/usr/