腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1559)
视频
沙龙
1
回答
Solr
索引
PDF
/
文档
后
集合
中
无
"
Content
“
字段
我收集了数以千计的
文档
/
pdf
,有很多
字段
,比如: url,title,date...etc。但是没有内容
字段
,这似乎是您必须存在的内容
字段
,以便能够按整个
文档
的关键字进行搜索,而不仅仅是标题。我看到一些人说,通常情况下,内容
字段
是在
索引
时自动生成的。 如何添加应包含
PDF
/
文档
中所有文本的内容
字段
?我使用的是
Solr
6,所以我知道我需要使用API来创建一个新<
浏览 11
提问于2019-10-18
得票数 0
回答已采纳
1
回答
与
PDF
文件一起使用
Solr
、
、
我想在
PDF
文件中使用
Solr
,但我不知道如何配置solrconfig.xml和schema.xml。我应该在那些文件里写些什么?其目的是用同义词或拼写检查器进行全文搜索。(我在Windows上使用
Solr
,以后我将使用API SolrNet).Thank you!
浏览 1
提问于2018-06-21
得票数 0
回答已采纳
1
回答
如何在按
solr
搜索时显示文件内容而不是文件名
、
、
我有很多
pdf
文件(里面的文字),我想建立一个简单的搜
索引
擎来搜索包含给定关键字的句子。经过几个小时的搜索,我选择了
solr
作为工具。 我是
solr
的新手。我下载了最新的
solr
6.5.0并在windows 7
中
进行了设置。我使用以下命令创建了一个名为gettingstarted的
集合
,可以通过访问链接http://localhost:8983/
solr
/gettingstarted/browse进行
浏览 3
提问于2017-04-12
得票数 1
1
回答
文档
至少包含一个巨大的术语-
Solr
索引
错误。
、
、
我正面临这个问题,我的
PDF
文件之一,我认为,它未能被
索引
到
Solr
,因为它的大文件大小。我在网上看到的回复大多建议将'
content
‘的
字段
类型改为'text_general',我一直在使用它,但是这个特定的
PDF
仍然不能被
索引
。产生的错误: 异常写入
文档
id abc.com/files/hugepdf.
pdf
到
索引
;可能的分析错误:
文档
在fiel
浏览 4
提问于2017-07-26
得票数 0
1
回答
Apache
索引
、
每当应用程序上传
pdf
文档
时,我都希望对其进行
索引
。在
索引
时,我在filename和fileType中发送url,如下所示 http://localhost:8983/
solr
/update/extract?stream.file=/D:\apache-
solr
-3.3.0\example\exampledocs\Accessing_MySQL_from_IntalioBPMS.
pdf
&stream.c
浏览 6
提问于2011-09-08
得票数 0
1
回答
使用Cloudera搜索为
PDF
文档
编制
索引
、
、
、
我一直在尝试使用Cloudera Search,也就是Apache
Solr
来
索引
pdf
文档
。首先,我能够
索引
twitter上的推文。后来,我尝试对
PDF
文件进行
索引
。我已经使用solrctl和默认模式创建了相应的
集合
。/select查询输出
中
,我只得到了
content
和
content
-type
字段
。如何获取
solr
前端查询
中
的所有元数
浏览 7
提问于2017-05-19
得票数 0
2
回答
如何打印与
solr
7.6.0
中
的搜索查询匹配的
pdf
的实际内容
、
、
、
我使用的
solr
版本是7.6.0 (模式
无
模式)。我尝试使用默认提供的Post实用程序jar
索引
几个
PDF
文档
。现在,当我执行查询时,包含查询字符串的文件的细节将正确显示。但是我看不到任何有实际文件内容的
字段
。<str name="fmap.a">ignored_</str> <s
浏览 0
提问于2019-02-04
得票数 0
回答已采纳
1
回答
Solr
:您可以将整个
文档
分配到单个
字段
(
文档
中
找不到的
字段
)吗?
、
我必须将许多不同的
文档
(xls、pptx、txt、csv、
pdf
)放入
solr
核心。所有的
文档
都是非结构化和无关的。我想做一些类似的事情: 'filename':'doc1',} 在这种情况下,filename不是实际
文档
中
的标记,而是由用户分配的,
content
也不在实际
文档
中
,它将映射到整
浏览 0
提问于2016-03-17
得票数 0
3
回答
Solr
ExtractingRequestHandler提供空内容
字段
、
、
、
、
我使用
Solr
6.2.1和ExtractingRequestHandler (已经包含在
Solr
6.2.1
中
)来
索引
pdf
和word
文档
。所有
文档
(
pdf
和word)都有元数据
索引
(标题、日期、cp_revision、compagny、.)但内容
字段
始终是空的。根据,我应该有一个非空的内容
字段
:"Tika将所有提取的文本添加到
content
字段
<em
浏览 9
提问于2016-10-20
得票数 1
1
回答
Solr
无法为文本
字段
编制
索引
、
、
在尝试为包含text_general
字段
的
文档
编制
索引
时,我收到以下错误: Exception writing document id 93cf6aeb-54b0-471a-9325-5b8e95801131index options=DOCS_AND_FREQS_AND_POSITIONS 我尝试
索引
的
文档
如下所示: { "
content
":
浏览 72
提问于2019-09-06
得票数 1
回答已采纳
1
回答
Apache
solr
架构
字段
未显示在json结果
中
、
、
、
我正在使用Apache
solr
-5.1.0搜索
pdf
文档
,我使用bin/post方法对所有
文档
进行了
索引
。我使用curl添加了一个自定义
字段
,如 "add-field":{/taxsutra/schema 现在,当我调用搜索查询时,这个ZoneI
浏览 0
提问于2015-05-14
得票数 0
1
回答
将多个文件同时
索引
到一个
solr
文档
中
、
我正在
索引
一些课程数据(id,名称,摘要)以及与这些课程相关的附件。通过传递文字
字段
,我使用提取RequestHandler对
文档
进行
索引
。 如何用独特的课程id映射多个
文档
浏览 3
提问于2013-07-28
得票数 1
回答已采纳
1
回答
从Apache
Solr
中提取
PDF
、
我是
Solr
索引
的新手。我使用了
Solr
5.5,并在其中
索引
了一个
pdf
文件,只需使用我删除了源
pdf
文件。有没有我可以从Apache
Solr
中提取
pdf
文件的方法。我可以从URL中看到它的
索引
http://localhost:8983&
浏览 10
提问于2017-07-09
得票数 0
回答已采纳
1
回答
使用Apache
索引
pdf
文件内容
、
、
我使用
Solr
的与Apache交互。我正在为数据库
中
的数据
索引
。我也想
索引
外部文件的内容(比如
PDF
、PPTX)。$res = $client->addDocument($doc);接下来,我想在上面的
solr
文档
中
添加
PDF
文件的内容。编辑#1:如果我尝试在curl请求
中
设置literal.id=xyz,它将创建一个具有id=xyz的新
solr
<
浏览 1
提问于2013-07-12
得票数 3
1
回答
无法在
Solr
5.0
中
显示
索引
内容
内容
字段
在搜索过程
中
无法显示,即使使用managedSchemaResourceName
中
命名的资源
中
的curl将以下行添加到模式
中
也是如此。我已经添加了内容
字段
行,以允许在用户执行查询时显示
索引
内容,因为默认设置不是要显示的内容。
文档
被成功
索引
,当我从内容
中
搜索任何单词时,搜索能够返回
文档
ID和其他信息,如主题、作者、日期等。但是,
文档
的内容没有显示。 这是我从结果
中</
浏览 2
提问于2015-03-04
得票数 1
1
回答
是否保留了原始
文档
的引用?
、
这是一个
Solr
的新手问题--但是对我来说理解
Solr
是如何工作的以及它是否适合我的项目是非常重要的。 我想
索引
二进制
文档
,即MS-Office
文档
和
PDF
。我知道
Solr
可以
索引
这些
文档
的内容,并且我可以构建查询来获取我指定的值和
字段
作为结果。我的问题是,扫描
后
PDF
(或任何
文档
)会发生什么?它实际上是被存储的还是完全被丢弃的,我能得到一个指向原始
文档
浏览 2
提问于2011-07-07
得票数 0
2
回答
仅检索突出显示的
solr
字段
,而不是整个内容
、
我想用
solr
来
索引
pdf
,word
文档
。word /
pdf
文档
的全部内容都会出现在搜索响应
中
,还会出现突出显示的片段。内容相当长,我想在搜索响应
中
避免它,因为内容长度。是否可以只获取
content
字段
中
突出显示的片段?http://localhost:8080/
solr
4x/collection1/s
浏览 0
提问于2013-05-15
得票数 1
回答已采纳
1
回答
Solr
部分搜索
、
(这里是
solr
新手)我设置了一个简单的
solr
实例来
索引
html/
pdf
文档
的
集合
。它基本上可以工作,但我只能尝试添加部分搜索功能。到目前为止,我尝试过的是:由于我认为保留默认的托管模式更好,所以我尝试使用模式api添加带有ngram过滤器的
字段
text_partial,就像这样。curl -X POST -H '
Content
-type:application/json' --data-binary
浏览 1
提问于2019-08-09
得票数 0
回答已采纳
1
回答
将多个二进制文件
索引
为唯一的solrDocument
、
、
我想为同一个
Solr
ID
索引
多个
pdf
文件。(所有
字段
都期望“文件”)
索引
到我们的
Solr
6服务器
中
。现在,我们需要一个进程来将所有文件内容
索引
到同一个ID的
Solr
中
。":["
content
_of_file1", "
content
_of_file2", ...], "files":["/
浏览 1
提问于2017-09-04
得票数 0
回答已采纳
1
回答
如何用SolrJ
索引
pdf
的内容?
、
、
我试图使用SolrJ
索引
一些
pdf
文档
,如中所描述的,下面是代码: System.out.println(entry.getValue());} 不幸的是,在查询**时,我得到了
索引
文档
列表,但内容
字段
为空。<
浏览 2
提问于2011-04-17
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
全文检索之Solr7.4服务器
搜索系统,原来可以这么简单
Whoosh:Python 的轻量级搜索工具
MongoDB系列6:MongoDB索引的介绍
量数据搜索——搜索引擎
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券