首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何将结构化数据导入Solr

译者微博:@从流域到海域 译者博客:blog.csdn.net/solo95 如何将结构化数据导入Solr 这篇文章总结了我们在搜索中数据提取方面的经验。...几乎所有的搜索项目都将现有数据注入到搜索引擎。在这篇文章中,我们主要关注是旧良好关系数据库作为数据源。我甚至不犹豫要键入什么:SQL数据库,还是not-NoSQL DB ?....Solr数据导入处理器 - DIH 首先我要说明是,我是数据导入处理器(Data Import Handler)忠实粉丝。...,在这种情况下,DIH会同步向Solr提供一个文档,并在通过DistributingUpdateProcessor将每个文档发送到碎片引导程序之前阻止任何文档。...然而,我们热衷是关于构建Solr XML特定问题。我遇到困难是平面关系元组(即二位元组,译者注)限制(称之为行或记录)。

2K20

Solr之搭建Solr6.0服务并从Mysql导入数据

目前百度上面关于solrMYSQL集成一般都是4.0左右。但是前solr版本已经到了6.0,很多配置都和一起不一样了。所以我今天就和大家聊聊solr6.0如何进行MYSQL数据配置。...其中solrdata是数据库名,goods是表名。   其中deltaQuery是增量索引,原理是从数据库中根据deltaQuery指定SQL语句查询出所有需要增量导入数据ID号。...然后根据deltaImportQuery指定SQL语句返回所有这些ID数据,即为这次增量导入所要处理数据。...核心思想是:通过内置变量“{dih.delta.id}”和 “{dataimporter.last_index_time}”来记录本次要索引id和最近一次索引时间。  ...选择刚刚添加goods实体进行索引操作:我们这儿可以选择full-import或者delta-import(增量索引),选择增量索引需要把clean勾给去掉,不然会清除之前,增量索引初衷是对新增或者修改记录重新索引

1.5K20
您找到你想要的搜索结果了吗?
是的
没有找到

【技术分享】Solr DataImportHandler组件漏洞

编号 CVE-2019-0193 漏洞简介 DataImportHandler是一个可选但使用广泛模块,默认不启用,用于从数据库和其他源中提取数据,它有一个特性即整个DIH配置可以来自一个请求“dataConfig...DIH管理调试模式使用它来方便地调试DIH配置开发。因为DIH配置可以包含script脚本,所以这个参数存在安全风险。...从Solr8.2.0版本开始,使用这个参数需要设置 Java System property,设置"enable.dih.dataConfigParam" true.。...环境搭建是编制漏洞POC永恒过程,通过认真进行环境搭建有助于清晰实际利用难度,了解应用资产部署范围、准确梳理漏洞利用思路,切实提出有效修复方案。...特性ScriptTransformer,称为脚本转换器,使用菜单项dataimport功能时通过连接数据源获取数据索引,然后触发用户自定义script处理查询出来数据,实现命令执行。

69630

Solr

"/> 结果比较 # 导入数据DIH DIH全称是Data Import Handler 数据导入处理器,顾名思义这是向solr导入数据,...我们solr目的就是为了能让我们应用程序更快查询出用户想要数据,而数据存储在应用中各种地方入xml、pdf、关系数据库中,那么solr首先就要能够获取这些数据并在这些数据中建立索引来达成快速搜索目的...,这里就列举我们最常用从关系型数据库中向solr导入索引数据。...-- 配置加入数据导入数据库驱动jar包 --> <lib dir="${<em>solr</em>.install.dir:../..}...,先操作<em>solr</em>,再操作<em>mysql</em> 查询只查询<em>solr</em>就可以 #<em>solr</em>挂了 查询<em>MySQL</em> 修复后同步一下<em>数据</em>,可以修改<em>导入</em>sql添加筛选时间条件

1.2K20

Solr 中 core 创建后数据导入

前言 在笔记1中,我们已经介绍了Solr下载及单节点启动和配置,以及如何创建core,但是如何进行数据导入却还没有介绍。...这篇文章就将教你在创建core之后,应该如何进行相关配置并导入数据; 配置数据库 笔记1中,在创建core时,有一个solrconfig.xml文件,如下图所示: 打开该文件,并在文件config...--以下字段column属性对应数据库中字段名称,name是对应solr这边配置名称; 注意id,默认名称即为id,表示solr这边一条数据主键,需要字段建立索引关系...有全局索引和增量索引,所以上述配置中有两次query操作; 全局索引:对应上述配置query,即将所有要建立索引数据均重新建立一般,当数据量很大时除开第一次导入数据之外不推荐,比较耗时; 增量索引...:对应上述配置deltaQuery,即将数据库中新增数据建立索引,加入solr查询中; 数据库驱动包:因为配置中用到MySQL数据库,因此需要导入MySQL数据库驱动包,从网上找到驱动包后,将其放入

70220

Solr索引擎 — 通过mysql配置数据

上一节我们已经通过两种方式运行了solr,本节演示怎么配置solrmysql数据源 附上: 喵了个咪博客:http://w-blog.cn Solr官网:http://lucene.apache.org...因为我们需要使用mysql作为数据源,我们需要增加对mysql使用jar包 > cd server/solr-webapp/webapp/WEB-INF/lib/ > wget http:...//pic.w-blog.cn/mysql-connector-java.jar 二、增加solr-core > PS:这里基础solr命令启动程序并未基于tomcat进行配置,后续cloud集群会使用...,连接mysql也支持其他数据库 query:查询数据库表符合记录数据 deltaQuery:增量索引查询主键ID 注意这个只能返回ID字段 deltaImportQuery:增量索引查询导入数据...当然也可以通过请求URL方式进行数据更新,这里也方便索引更新和程序相结合 http://172.16.3.148:8983/solr/new_core/dataimport?

1.5K10

Solr 笔记 2-core 创建后数据导入

Solr 笔记 2-core 创建后数据导入 前言 在笔记 1 中,我们已经介绍了Solr下载及单节点启动和配置,以及如何创建core,但是如何进行数据导入却还没有介绍。...--以下字段column属性对应数据库中字段名称,name是对应solr这边配置名称; 注意id,默认名称即为id,表示solr这边一条数据主键,需要字段建立索引关系...有全局索引和增量索引,所以上述配置中有两次query操作; 全局索引:对应上述配置query,即将所有要建立索引数据均重新建立一般,当数据量很大时除开第一次导入数据之外不推荐,比较耗时; 增量索引:对应上述配置...deltaQuery,即将数据库中新增数据建立索引,加入solr查询中; 数据库驱动包:因为配置中用到MySQL数据库,因此需要导入MySQL数据库驱动包,从网上找到驱动包后,将其放入solr-xxx/...type表示类型,solr中会有很多类型,这个在managed-schema中你会看到很多fieldType标签,都是solr类型 indexed:表示是否建立索引,true建立,

80630

solr简单安装mysql导入同步数据

我们将使用其中一种,以说明Solr如何索引数据。server 文件夹包含logs 文件夹,所有Solr日志都写入该文件夹。这将有助于索引过程来检查任何错误日志。...在sever文件夹下Solr文件夹包含不同集合或核心(core/collection)。对于各集合或核心配置和数据都存储在相应集合或核心文件夹。...刚才配置字段成功,也可以通过图形管理界面添加field 4.配置mysql导入数据 编辑solr-6.4.1\server\solr\testCore\conf\solrconfig.xml 在</...进入solr-6.4.1\server\lib\ext 找到所有logjar包 ?...还有mysql或者其他数据驱动 复制到 solr-6.4.1\server\solr-webapp\webapp\WEB-INF\lib 目录 重启solr服务 ? 5.测试导入是否成功 ?

2K30

Solr core创建后数据导入

--以下字段column属性对应数据库中字段名称,name是对应solr这边配置名称; 注意id,默认名称即为id,表示solr这边一条数据主键,需要字段建立索引关系...有全局索引和增量索引,所以上述配置中有两次query操作; 全局索引:对应上述配置query,即将所有要建立索引数据均重新建立一般,当数据量很大时除开第一次导入数据之外不推荐,比较耗时; 增量索引:对应上述配置...deltaQuery,即将数据库中新增数据建立索引,加入solr查询中; 数据库驱动包:因为配置中用到MySQL数据库,因此需要导入MySQL数据库驱动包,从网上找到驱动包后,将其放入solr-xxx/...webapps/solr/WEB-INF/lib文件夹中; 配置managed-schema文件 即在笔记 1 中创建core后所出现schema.xml文件,该文件配置内容solr索引中引入字段类型设置...type表示类型,solr中会有很多类型,这个在managed-schema中你会看到很多fieldType标签,都是solr类型 indexed:表示是否建立索引,true建立,

86510

【漏洞预警】Apache Solr远程代码执行漏洞 (CVE-2019-0193)处置手册及技术分析

是用于从数据库或其他源提取数据常用模块,该模块中所有DIH配置都可以通过外部请求dataConfig参数来设置,由于DIH配置可以包含脚本,因此该参数存在安全隐患。...4漏洞防护 4.1 官方升级 从Solr8.2.0版本开始,使用问题参数dataConfig需要将java系统属性“enable.dih.dataconfigparam”设置true。...2、确保网络设置只允许可信流量与Solr建立通信,尤其是与DIH请求处理通信。 4.3 产品防护 针对此漏洞,绿盟科技防护产品已发布规则升级包,可形成针对此漏洞防护能力。...数据solr会把最后更新时间记录到配置文件中,这个时间是为了下次进行增量更新时候用。...接着通过this.dataImporter.getStatus()判断当前数据导入是“全部导入”还是“增量导入”,两个操作对应方法分别为doDelta()和doFullDump(),此处操作是full-import

1K10

Mysql数据导入SolrCloud

Solr主要是做数据搜索,那么Solr数据是从哪里来呢?总不能一条一条插入吧。Solr也有这方面的考虑,比如配置Dataimport将mysql数据批量导入Solr中。...环境说明: ambari v2.6.1 SolrCloud 5.5.5 我使用ambari来自动化安装Solr ---- 一、创建mysql表,并插入数据 创建 test数据库,并执行下列语句 use.../usr/lib/ambari-infra-solr/example/example-DIH/solr/db/conf目录下;SolrCloud里面也有默认一组 configset配置组,位置在 Zookeeper...多个entity时,进行full-import时指明导入某个entity。 delta-import 主要是对于数据库(也可能是文件等等)中增加或者被修改字段进行导入。...如果不选择此参数那么所有的都会被运行。 clean 选择是否要在索引开始构建之前删除之前索引,默认为true commit 选择是否在索引完成之后提交。

4.3K20

Apache Solr DataImportHandler 远程代码执行漏洞(CVE-2019-0193) 分析

Solr DataImportHandler可以批量把数据导入索引库中,根据Solr文档[2]中描述,DataImportHandler有如下功能: •读取关系数据库中数据或文本数据•根据配置从xml...(http/file方式)读取与建立索引数据•根据配置聚合来自多个列和表数据来构建Solr文档•使用文档更新Solr(更新索引、文档数据库等)•根据配置进行完全导入功能(full-import,完全导入每次运行时会创建整个索引...通过web页面创建core 一开始以为从web页面无法创建core,虽然有一个Add Core,但是点击创建core目录无法使用,提示无法找到配置文件,必须在solr目录下创建好对应core,在...(查询语句、url等等)要读什么样数据(关系数据库中列、或者xml域)、做什么样处理(修改/添加/删除)等,Solr这些数据数据创建索引并将数据保存为Document 对于此漏洞需要了解dataConfig...flatten(可选):如果设置true,则无论标签名称如何,所有标签下文本都将提取到一个字段中 实体field可以具有以下属性: xpath(可选):要映射记录字段

2.1K20

干货 | 如何用Solr搭建大数据查询平台

Solr安装完成,现在我们需要从mysql导入数据导入前,我们需要先创建一个core,core是solr特有概念,每个core是一个查询、数据,、索引集合体,你可以把它想象成一个独立数据库,我们创建一个新...-5.5.0/example/example-DIH/solr/db/conf下面的所有文件全部拷贝到我们创建conf目录中.接下来配置主要涉及到三个文件, solrconfig.xml, schema.xml...保存后,core配置就算完成了,不过要导入mysql数据,我们还需要在mysql网站上下载mysql-connector-java-bin.jar库文件,连同solr-5.5.0/dist目录下面的...,mysql只负责存储整理好数据,并不提供查询服务,整理和导入数据库时,只需操作mysqlsolr利用自带jetty独立运行,定期从mysql导入增量更新数据,Tomcat作为应用服务器,运行提供查询...core命名为solr_newsgk,在db-data-config.xml中做如下设置: last_index_time和delta.id是两个自动变化参数,分别记录最后一次导入数据时间和已导入最大

4.5K70

Apache Solr DataImportHandler远程代码执行漏洞(CVE-2019-0193) 分析

id,然后再根据文档id去文档信息库获取文档信息 Solr DataImportHandler Solr DataImportHandler可以批量把数据导入索引库中,根据Solr文档中描述,DataImportHandler...两种模板可以使用 通过web页面创建core 一开始以为从web页面无法创建core,虽然有一个Add Core,但是点击创建core目录无法使用,提示无法找到配置文件,必须在solr目录下创建好对应...(查询语句、url等等)要读什么样数据(关系数据库中列、或者xml域)、做什么样处理(修改/添加/删除)等,Solr这些数据数据创建索引并将数据保存为Document 对于此漏洞需要了解dataConfig...flatten(可选):如果设置true,则无论标签名称如何,所有标签下文本都将提取到一个字段中 实体field可以具有以下属性: xpath(可选):要映射记录字段...如果true,则在创建Solr文档之前,记录中遇到此 字段将被复制到其他记录 PoC进化历程 PoC第一阶段--数据库驱动+外连+无回显 根据官方漏洞预警描述

1.4K00

全文检索引Solr系列——入门篇

Solr采用Lucene搜索库核心,提供全文索引和搜索开源企业平台,提供RESTHTTP/XML和JSONAPI,如果你是Solr新手,那么就和我一起来入门吧!...数据导入 导入数据Solr方式也是多种多样: 可以使用DIH(DataImportHandler)从数据导入数据 支持CSV文件导入,因此Excel数据也能轻松导入 支持JSON格式文档 二进制文档比如...:Word、PDF 还能以编程方式来自定义导入 更新数据 如果同一份文档solr.xml重复导入会出现什么情况呢?...当然solr也有数据库中事务,执行删除命令时候事务自动提交了,文档就会立即从索引中删除。你也可以把commit设置false,手动提交事务。...现在把刚刚删除文件重新导入Solr中来,继续我们学习。 删除所有数据: 1 http://localhost:8983/solr/collection1/update?

98110

三、Solr管理控制台(二)

索引库相关操作 Overview 索引总览,显示集合信息和分片信息 Analysis 分析器:这个功能可以用来调试字段分词效果 左边部分是针对索引解析器处理过程,右边部分是针对查询解析器处理过程...) Dataimport 数据导入:可以将其他数据数据导入Solr中,8.6版本后官方就不建议使用这种方式了 有的人安装完Solr后点击这个菜单不一定会出来这个界面或者有显示这个界面,但是功能确不能正常使用...管理控制台,点击dataimport菜单 选择完数据源后点击Execute按钮,等待数据导入完成,当然导入数据如果字段不存在的话,需要实现在manage-schema配置文件中进行配置并重启Solr...才能导入 Documents 索引文档相关操作,一般新增、修改、删除索引文档数据都在这个菜单完成 我们可以看到请求处理器是/update 对应配置文件,可以到solrconfig.xml文件中进行查看...查询所属有文档: : 查询id1文档:id:1 查询id大于等于1小于等于10文档:id:[1 TO 10] 查询主文档,当然,需要在主文档中所有索引数据添加isParent_b字段,

1.5K10

Solr索引擎 — SolrCloud安装和集群配置

并且注释文件末尾所有 元素节点 > vim /data/wwwroot/default/solr/WEB-INF/web.xml ...tomcat就可以正常访问到solr-ui了 ---- 三、添加Collection使用索引功能 PS:集群下Collection等同于单机core ---- 四、配置mysql索引 使用SolrCloud...来去进行配置过程和单机模式基本一致,但是有以下几个多出来事情: 修改完new_core配置需要通过zookeeper进行配置文件上传才能生效; 依赖各种jar包mysql,分词和拼音等每个集群节点都需要添加才能生效.../conf -confname myconf PS:分词配置和依赖jar包同理 ---- 五、集群机制测试 测试容错 关闭主节点solr-1 在数据查询上 另外两个节点依然可以提供数据查询服务 重启.../classes/ext.dic 美团 保存后重启所有节点重新初始化数据 增加了分词文件节点可以识别 未增加分词文件节点无法识别 影响范围是局部,并且一定要重启才能生效(当然这个是IK分词库决定

52820

Lucene&Solr框架之第三篇

b)配置中文分析器 2、配置业务域和批量索引导入 a)配置业务域 b)批量索引导入 c)Solrj复杂查询(用Query页面复杂查询、用程序实现) 3、京东案例(简单站内搜索实现)...3.4.配置数据导入requestHandler 在昨天也介绍solr可视化管理工具中有一个Dataimport功能,就是用于批量导入数据创建索引: 在上一节我们已经事先配置了业务域,下面需要利用批量导入插件将...mysqlproducts表中数据批量创建索引: 3.4.1.第一步:导入插件依赖jar 先在一个SolrCore实例(collection1)下创建一个lib文件夹,然后把dataimport...·Clean:(默认选中)表示导入数据前会自动清空之前索引文件 ·Commit:(默认选中)表示创建索引会自动提交 ·Auto-Refresh Status:(默认不选中)它是控制到导入数据过程中界面是否自动刷新...导入成功界面: 3.5.测试导入索引 3.5.1.solr查询语法 1.q:查询关键字,必须

1.6K20
领券