的所有功能
RESTful API: 要与Solr通信,可以使用RESTful服务与Solr通信,可以使用XML,JSON,CSV等格式的文件作为输入文档,并以相同的文件格式获取结果
全文搜索: Solr...提供了全文搜索所需的所有功能:令牌,短语,拼写检查,通配符,自动完成
企业准备: 根据企业或组织的需要,Solr可以部署在任何类型的系统:独立,分布式,云
灵活可扩展: 通过扩展Java类并进行相关配置...有助于在网上定位信息
用户可以通过以关键字或短语的形式将查询传递到搜索引擎中来搜索信息,然后搜索引擎搜索其数据库并向用户返回相关链接
搜索引擎组件
搜索引擎有三个组件:
Web爬虫: 一个收集网络信息的软件组件....索引类似于在书开始页或末尾处的目录索引,其中常见单词以页码显示,使得这些单词可以快速追踪,而不是搜索整本书
用于搜索的用户接口: 当索引数据库就绪,应用程序就可以执行搜索操作.为了帮助用户进行搜索,应用必须提供用户接口...即根据观测到的数据(标注好的语料)对模型参数进行估计.即 训练
在分词阶段再通过模型计算各种分词出现的概率,将概率最大的分词结果作为最终结果
常见的序列标注模型:HMM,CRF
基于统计及机器学习的分词方式优点