首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

全文检索Solr集成HanLP中文分词

以前发布过HanLP的Lucene插件,后来很多人跟我说其实Solr更流行(反正我是觉得既然Solr是Lucene的子项目,那么稍微改改配置就能支持Solr),于是就抽空做了个Solr插件出来,开源在Github...HanLP中文分词solr插件支持Solr5.x,兼容Lucene5.x。...本教程使用Solr5.2.1,理论上兼容solr5.x。 放置jar 将上述两个jar放到solr-5.2.1/server/solr-webapp/webapp/WEB-INF/lib目录下。...启动solr 首先在solr-5.2.1\bin目录下启动solr: 1.solr start -f 用浏览器打开http://localhost:8983/solr/#/,看到如下页面说明一切正常:...要知道,不少中文分词器眉毛胡子一把抓地命中“商品和服务”这种错误文档,降低了查准率,拉低了用户体验,跟原始的MySQL LIKE有何区别?

1.3K30

Solr_全文检索引擎系统

Solr的作用: solr是一个现成的全文检索引擎系统, 放入tomcat下可以独立运行, 对外通过http协议提供全文检索服务(就是对索引和文档的增删改查服务), 在代码中可以通过solrJ(solr...Lucene和solr的区别: lucene是一个全文检索引擎工具包, 就是一堆jar包, 它放入tomcat下不能独立运行, 但是我们可以使用lucene来构建全文检索引擎系统; solr底层是用lucene...来开发的一个全文检索引擎系统, 放入tomcat下就可以独立运行, 对外通过http的形式,提供全文检索服务(索引和文档的增删改查服务)。...在Tomcat容器中部署solr工程的步骤: 1、下载solr压缩包,下载地址:http://archive.apache.org/dist/lucene/solr/(我这里使用的是solr-4.10.3...18 server.deleteByQuery("*:*"); 19 //3、提交 20 server.commit(); 21 } 需求四:检索

1.1K80
您找到你想要的搜索结果了吗?
是的
没有找到

全文检索引擎Solr系列—–全文检索基本原理

类似数据库中的表结构: word page_no --------------- 坑 38 爹 90 ... ......对于全文检索也是类似的原理,它可以归结为两个过程:1.索引创建(Indexing)2. 搜索索引(Search)。那么索引到底是如何创建的呢?索引里面存放的又是什么东西呢?...如果是想搜既包含”lucene”又包含”solr”的文档,那么与之对应的两个倒排表去交集即可获得:3、10、35、92。...一个文档由多个(或者一个)词(Term)组成,比如:”solr”, “toturial”,不同的词可能重要性不一样,比如solr就比toturial重要,如果一个文档出现了10次toturial,但只出现了一次...solr,而另一文档solr出现了4次,toturial出现一次,那么后者很有可能就是我们想要的搜的结果。

64640

mysql数据库(7):表中检索信息

如果你使用两个操作符,使用圆括号指明如何对条件进行分组是一个好主意: mysql> select * from pet where( owner='思思' and species='dog') ->...'pig');  (4)选择特殊列:select name,birth from pet;  找出谁拥有宠物,使用这个查询:select owner from pet;  请注意该查询只是简单地检索每个记录的...为了使输出减到最少,增加关键字DISTINCT检索出每个唯一的输出记录:select distinct owner from pet;  可以使用一个WHERE子句结合行选择与列选择。...添加ORDER BY name子句按照名字对输出进行排序则能够实现 mysql> SELECT name, birth, CURDATE(), -> (YEAR(CURDATE())-YEAR(birth...)) -> - (RIGHT(CURDATE(),5) -> AS age from pet;  了按age而非name排序输出,只要再使用一个ORDER BY子句: mysql> SELECT name

4.4K20

全文检索引擎Solr系列——入门篇

下载解压缩solr,在example目录有start.jar文件,启动: 1 java -jar start.jar 浏览器访问:http://localhost:8983/solr/,你看到的就是solr...-jar post.jar solr.xml monitor.xml 上面的命令是向solr添加了两份文档,打开这两个文件看看里面是什么内容,solr.xml里面的内容是: 1 2 3 4 5 6...数据导入 导入数据到Solr的方式也是多种多样的: 可以使用DIH(DataImportHandler)从数据库导入数据 支持CSV文件导入,因此Excel数据也能轻松导入 支持JSON格式文档 二进制文档比如...当然solr也有数据库中的事务,执行删除命令的时候事务自动提交了,文档就会立即从索引中删除。你也可以把commit设置为false,手动提交事务。...安装到部署,文档更新,对solr有了初步感性的认识,下一篇将介绍全文检索的基本原理。

97410

solr or es 结合弥补mongodb的全文检索功能

公司里用的最多的数据库就是mongodb了,大数据量存储,天生集群支持,分片更简单。 mongodb唯一不足的就是全文检索的能力,不过大部分公司都是用的搜索框架来单独提供搜索服务的。...如果我们存储了所有字段,那么其实相当于把solr或者es当成数据库在用了,搜索的结果可以直接返回给调用方,不用经过mongodb,此时mongodb只作为一个元数据存储使用。...这么说可能大家不太理解,如果有用过数据库中间件mycat的同学肯定就有点印象了。 就是跟mycat一样,mycat是基于mysql协议来封装的。...对于用户来说就是可以把mycat当做一个mysql来用,mycat后面其实有多台mysql的节点,但是对于使用方来说就只有一个,屏蔽了分库分表的细节部分。...可以执行mongodb的所有操作,当然需要配置哪些字段需要做全文检索操作,需要分词等等。

1.8K140

搞定MySQL数据库中文模糊检索问题

MySQL下,在进行中文模糊检索时,经常会返回一些与之不相关的记录,如查找 "%a%" 时,返回的可能有中文字符,却没有a字符存在。...本人以前也曾遇到过类似问题,经详细阅读MySQL的Manual,发现可以有一种方法很方便的解决并得到满意的结果。   ...title like '%a%'   返回的结果,某些title字段确定带了“a”关键字,而有些则只有中文,但也随之返回在检索结果中。   ...'%a%'   返回的结果较之前正确,但英文字母区分大小写,故有时在检索如“Achech”及“achech”的结果是不一样的。...知道了使用 BINARY 属性可以解决前面这个问题,再看看 MySQL 支持的UCASE 及 CONCAT 函数,其中 UCASE 是将英文全部转成大写,而CONCAT函数的作用是对字符进行连接,以下是我们完全解决后的

2K20

mysql全文检索 分词_sqlserver全文检索

前言 通常情况下,全文检索引擎我们一般会用ES组件(传送门:SpringBoot系列——ElasticSearch),但不是所有业务都有那么大的数据量、那么大的并发要求,MySQL5.7之后内置了ngram...分词器,支持中文分词,使用全文索引,即可实现对中文语义分词检索 MySQL支持全文索引和搜索:   MySQL中的全文索引是FULLTEXT类型的索引。   ...MySQL5.7提供了一个内置的全文ngram解析器,支持中文,日文和韩文(CJK),以及一个可安装的MeCab日文全文解析器插件。   ...MySQL全文检索官方文档介绍:https://dev.mysql.com/doc/refman/5.7/en/fulltext-search.html   查看MySQL版本 -- 查看mysql版本...,在数据量不大、并发要求不高的情况下足够满足我们业务需要,无需上ES全文检索引擎 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/172608.html原文链接:https

13.7K40

全文检索工具solr:第二章:安装配置

linux安装Solr:可以参考全文检索工具elasticsearch:第二章:安装配置配置类似 点击下载solr windows中Solr安装 1:安装 Tomcat,解压缩即可。...检索运算符 “:”  指定字段查指定值,如返回所有值*:*  “?”  表示单个任意字符的通配  “*”  表示多个任意字符的通配(不能在检索的项开始使用*或者?...符号)  “~”  表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。...">      FIle可以理解为数据库中的字段,相当于列 配置业务域...域 要想让solr能够存储信息,我们还得定义列,也叫域,相当于数据库中的字段 修改solrhome的schema.xml 文件  设置业务系统 Field <field name="sku_name"

64540

Mysql的全文检索

mysql分词索引 前言 使用范围及限制 全文检索的全局配置 数据准备 全文检索元数据 INNODB_FT_CONFIG INNODB_FT_BEING_DELETED INNODB_FT_DELETED...全文检索扩展查询(同义词效果) 自定义停用词 ngram全文检索器(中文停用词) 前言 可以直接跟着官方敲一下: mysql官方文档-fulltext 现在的产品一言不合就想分词或者全模糊查询,之前的解决方案有...全文检索的一些使用操作说明: MYSQL DBMS 查找至少包含一个字符串的行 +MYSQL +DBMS 查找包含两个的字符串 +MYSQL DBMS 查找包含MYSQL的行,如果有DBMS则按照优先级进行排序...+MYSQL -DBMS 查找包含MYSQL但是不包含DBMS的行 '"MySQL Tutorial"' 双引号将词语进行组合 官网还有其他组合,比如 ~ 号,没太了解清楚,不记录了 全文检索扩展查询...') id title body --- 8 数据库应用开发 学习开发数据库应用程序 7 数据库管理 在本教程中我将向你展示如何管理数据库 不同的模式有细微的不同, 官网有一个小示例: 如果是 natural

1.7K40

全文检索工具solr:第一章:理论知识

什么是Solr大多数搜索引擎应用都必须具有某种搜索功能,问题是搜索功能往往是巨大的资源消耗并且它们由于沉重的数据库加载而拖垮你的应用的性能。...Solr是一个开源搜索平台,用于构建搜索应用程序。 它建立在Lucene(全文搜索引擎)之上。 Solr是企业级的,快速的和高度可扩展的。 使用Solr构建的应用程序非常复杂,可提供高性能。...并于2016年发布最新版本Solr 6.0,支持并行SQL查询的执行。Solr可以和Hadoop一起使用。由于Hadoop处理大量数据,Solr帮助我们从这么大的源中找到所需的信息。...不仅限于搜索,Solr也可以用于存储目的。像其他NoSQL数据库一样,它是一种非关系数据存储和处理技术。总之,Solr是一个可扩展的,可部署,搜索/存储引擎,优化搜索大量以文本为中心的数据。...可以,Spring Data Solr就是为了方便Solr的开发所研制的一个框架,其底层是对SolrJ(官方API)的封装。

32020

全文检索工具solr:第一章:理论知识

什么是Solr 大多数搜索引擎应用都必须具有某种搜索功能,问题是搜索功能往往是巨大的资源消耗并且它们由于沉重的数据库加载而拖垮你的应用的性能。...Solr是一个开源搜索平台,用于构建搜索应用程序。 它建立在Lucene(全文搜索引擎)之上。 Solr是企业级的,快速的和高度可扩展的。 使用Solr构建的应用程序非常复杂,可提供高性能。...并于2016年发布最新版本Solr 6.0,支持并行SQL查询的执行。 Solr可以和Hadoop一起使用。由于Hadoop处理大量数据,Solr帮助我们从这么大的源中找到所需的信息。...不仅限于搜索,Solr也可以用于存储目的。像其他NoSQL数据库一样,它是一种非关系数据存储和处理技术。 总之,Solr是一个可扩展的,可部署,搜索/存储引擎,优化搜索大量以文本为中心的数据。...-- solr服务器地址 --> <!

40200

【程序源代码】Springboot2.1+Solr7.5搭建的企业级搜索平台

介绍 Springboot2.1+Solr7.5搭建的企业级搜索平台,项目目前支持文档内容和数据库检索,已经集成分词技术。...支持文档内容检索类型包含:pdf、doc、docx、ppt、pptx、txt、log等 数据库已支持MySQL增量自动建立索引 部署教程 solr安装启动 进入 solr-7.5.0/bin...Solr配置说明 Solr MySQL相关 进入 solr-7.5.0/server/solr/test_core/conf db-data-config.xml -> 需要索引的表配置 managed-schema...-> 需要索引的字段配置 Solr MySQL 数据自动增量同步配置说明 进入 solr-7.5.0/server/solr/conf/ dataimport.properties -> 自动同步数据相关配置...Solr 文件检索配置 进入 solr-7.5.0/server/solr/file_core/conf tika-data-config.xml -> 索引文件目录及类型配置 managed-schema

64210

Solr之搭建Solr6.0服务并从Mysql上导入数据

目前百度上面关于solrMYSQL的集成一般都是4.0左右。但是前solr的版本已经到了6.0,很多配置都和一起不一样了。所以我今天就和大家聊聊solr6.0如何进行MYSQL数据库的配置。...步骤2:   把mysql所需的jar包和solr-6.0\solr-6.0.0\dist下的solr-dataimporthandler-6.0.0.jar和solr-dataimporthandler-extras...步骤3:   在MYSQL中新建一张表。我这里用的是Navicat管理工具进行创建的。这里的表名是goods。...Field对应一个字段,column是数据库里的column名,后面的name属性对应着Solr的Filed的名字。其中solrdata是数据库名,goods是表名。  ...索引成功如下如所示: 使用query进行测试,输入sa查出了sa 数据库中的数据如下图所示: 这就成功的配置完了MYSQL数据库了,如果配置过程有啥问题可以参考我这个已经配置成功代码:点击打开链接

1.5K20
领券