腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8464)
视频
沙龙
1
回答
如
何在
索引
Solr
时
指定
文件类型
我一直在为包含html页面、文档、ppts、pdfs..etc的文件夹/文件的目录建立
索引
。我注意到一个名为LOG的
文件类型
正在被
索引
,我不希望它被
索引
,因为不需要它的内容。为了
索引
到
Solr
,我一直在使用这个命令(我是windows用户,所以我使用简单的post工具):java -Dc=collection -Dport=4983 -Drecursive -Dauto jarppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,h
浏览 14
提问于2019-11-01
得票数 0
回答已采纳
1
回答
对非
索引
字段的
Solr
查询搜索
、
Solr
版本6.1.0见下面的结果 只有当我
指定
非
索引
字段的全部值
时
,才会选择非
索引
字段。见q=Indi的结果 如何限制
solr
搜索非
索引
字段?
浏览 5
提问于2017-10-11
得票数 3
回答已采纳
1
回答
将
Solr
(4.8.1)指向目录(Windows 7)
、
、
、
、
我正在为文档目录(
文件类型
,
如
: MS Word、PDF、.txt、PowerPoint等)建立一个搜索系统。我接下来要去哪里?--更具体地说-- 是否有我需要集成的开源
索引
技术,或者
Solr
可以自己
索引
文档?我如何告诉
Solr
具体地在这个目录中搜索?(或者一般情况下,在我的硬盘/本地网络上的目录中)
浏览 1
提问于2014-06-13
得票数 2
回答已采纳
1
回答
要为
solr
搜索创建什么样的
索引
?
我已经在我的drupal 7服务器上运行了一个
solr
实例并在本地运行。我已经将服务器添加到我的drupal站点上的搜索配置中,现在我正在尝试创建搜索配置的“index”部分。根据本指南http://valuebound.com/resources/blog/installing-configuring-apache-
solr
-520-with-drupal-7-using-search-api-ubuntu-1404,我已经到了必须为文件设置
索引
的末尾。我计划
索引
一堆“富
浏览 0
提问于2017-10-30
得票数 -1
回答已采纳
2
回答
Solr
与EMC Documentum的集成
、
我们在EMC Documentum中提供了大量pdf文档我们有一个要求,我们必须将Apache
Solr
与Documentum集成,以便我们可以在
solr
中搜索特定文档,并从Documentum获取文档
浏览 0
提问于2016-05-19
得票数 0
1
回答
solr
搜索不存在字段的文档
、
、
、
如
何在
SOLR
索引
中搜索不包含
指定
字段文档?
浏览 0
提问于2010-12-06
得票数 40
回答已采纳
1
回答
用
Solr
SimplePostTool支持.txt和其他文件
、
、
、
、
我正在运行
Solr
4.8.1并使用SimplePostTool (示例\post.jar目录中的post.jar)进行
索引
。我可以成功地
索引
xml、json、csv、pdf、doc、docx、ppt、pptx、xls、xlsx文件,但是当尝试
索引
其他
文件类型
( .txt,7z .rar .EAP .sql .zip .avi)
时
,我给出了错误: "SimplePostTool:警告
Solr
返回一个错误#400坏请求SimplePostTool:警告: IOEx
浏览 1
提问于2014-07-01
得票数 0
1
回答
层次化面。所需实例
我是
solr
的新手。我想在我的应用程序中实现层次化的方面。我通过了,并准备了正确的xml。我可能听起来像个新手,但我被困住了。
浏览 2
提问于2013-08-30
得票数 1
回答已采纳
2
回答
MapReduceIndexerTool -在
Solr
中
索引
HDFS文件的最佳方法?
、
、
、
、
我需要将HDFS文件(包括TXT、PDF、DOCX和其他富文档)
索引
到
Solr
中。因此,现在我正在研究使用MapReduceIndexerTool的可能性。但它没有多少初学者(我指的是绝对基础!)层次的例子。在HDFS中是否有其他更好或更简单的方法来
索引
文件?
浏览 8
提问于2016-09-07
得票数 3
1
回答
Nutch crawl命令
、
、
对于Nutch 2.2.1,我知道有两个爬行命令- bin/nutch (step by step),bin/crawl (全部在一起) 我知道如何为bin/crawl命令
指定
爬网ID。同样,如何为bin/nutch命令
指定
爬网ID?我问的原因是,我使用all-in-one crawl command "bin/crawl"运行了一个大型爬网作业,
指定
了一个爬网ID,它在
Solr
中
索引
第9次爬行迭代
时
崩溃了。现在,我只
浏览 1
提问于2013-10-25
得票数 1
1
回答
如何实现apache
solr
搜索结果的排序和分页
、
、
我已经在Drupal7中集成了apache
solr
搜索模块,它工作得很好。我需要一些帮助来实现我的apache
solr
搜索结果的排序和分页。我已经修改了schema.xml文件,以
指定
哪些字段可用于排序。在从我的drupal的
solr
模块进行
索引
时
,我得到了所有字段的列表和排序选项。因此,请指导我下一步如
何在
我的搜索结果表中实现按列排序。
浏览 3
提问于2012-10-09
得票数 1
1
回答
Solr
标题搜索失败
、
、
我正在为
Solr
中的几个产品的标题字段
索引
。但是当我搜索的时候,我得不到这些标题的响应。但是当我跟随搜索
时
,我没有得到任何结果!1)标题:Baboons 2)标题:(Baboons打字T恤)3)标题:(Baboons*)1)标题:(T恤)我的问题基本上是:如果我有一个包
浏览 2
提问于2012-05-17
得票数 0
1
回答
如
何在
SOLR
中
索引
URL,这样我就可以在网站之后提高结果
我有数以千计的文档
索引
在我的
SOLR
,它代表的数据从不同的网站爬行。文档的一个字段是SourceURL,它包含我爬行并
索引
到此文档中的网页的url。 我想提升结果从一个特定的网站使用boost查询。您知道我如何
索引
url字段,然后使用boost查询来识别来自特定网站的所有文档,就像上面的情况一样?
浏览 0
提问于2011-09-08
得票数 5
回答已采纳
1
回答
Solr
法语本体
、
我想问一下如
何在
我的
solr
搜
索引
擎中实现像"WOLF“这样的法语本体。这个想法是,当我搜索"voiture“
时
,给我的结果也是"car”、"auto“、”auto“。到目前为止,我已经为我的数据建立了
索引
,并在我的搜
索引
擎中实现了一些插件(
如
词干、拼写检查...),它工作得很好。我计划这样做,用我收集的数据在同一个
solr
中
索引
所有的WOLF本体, 因此,当我搜索某个术语
时
,
浏览 2
提问于2014-02-06
得票数 1
1
回答
Solr
索引
自定义
文件类型
基本上,我是一个
Solr
新手,当我们的
Solr
专家离开公司
时
,我在这方面有过0的经验。我们正在从客户端接收一个文件,该文件是一个专有文件。我无法访问在其中生成它的应用程序。当上传到
Solr
时
,我们会收到以下错误
solr
-cloud.log: {"msg":"2022-01-19 08:10:06.915 ERROR (qtp349420578-3516HDFParser.java:88) at org.a
浏览 12
提问于2022-01-20
得票数 0
回答已采纳
1
回答
Solr
如何使用返回相同值的2个或更多过滤器存储字段类型?
、
<analyzer type="index"> <filter class="
solr
.LowerCaseFilterFactory"/> <filte
浏览 3
提问于2014-01-15
得票数 0
回答已采纳
1
回答
如何将文档字段从Mongo导入到目标系统(
如
ElasticSearch/
Solr
)?
、
、
、
ElasticSearch.提供了一个连接器,用于集成从数据库到目标的数据,例如
Solr
我使用这个连接器将数据从Mongo 从一个特定的数据库转移到ElasticSearch
索引
。我如
何在
将数据从数据库加载到ElasticSearch中的
索引
时
排除
指定
字段?
浏览 2
提问于2017-06-06
得票数 1
1
回答
solr
WordDelimiterGraphFilterFactory,从数字中删除0
我的文件中有这个领域: <analyzertype="index"> <filter class=&
浏览 1
提问于2020-03-19
得票数 1
回答已采纳
1
回答
自动
索引
时
的
Solr
9- 404
、
、
、
、
我安装了
Solr
9并在Windows 10上运行,在遵循这些教程之后- POSTing file example1.txt (text/plain) to [base]/extract - SimplePostTool: WARNING:
Solr
returned an error #404 只有当我调用特
浏览 11
提问于2022-08-26
得票数 0
1
回答
在导入丰富文档
时
,是否存在用于
SOLR
的最佳实践schema.xml?
、
、
、
、
我正在与
SOLR
合作,在这个项目中,我们导入了一堆(~40k项)丰富的文档,主要是import、Powerpoint、Excel和PDF。**
时
,在
SOLR
中是否有最佳实践和/或可供使用 我一直在对默认模式进行调整,试图让方面在日期修改时间上工作,但即使没有这些,我也认为很可能存在这样一个很好的例子,说明在Tika的默认输出已经足够
时
,这些文件应该是怎样的
浏览 0
提问于2011-12-05
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
全文检索之Solr7.4服务器
量数据搜索——搜索引擎
编程字典-Apache Solr 环境设置
【行业资讯】Apache Solr 8.7.0 发布,最流行的 Java 企业级搜索引擎
Django 搜索利器:django-haystack 模块化搜索框架详解
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券