腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如
何在
索引
/
存储
到
Solr
之前
删除
<a>
标签
-
内容
字段
中
的
内容
、
我用
solr
6.6.0为一些html文档建立了
索引
。在
内容
字段
中有大量
的
链接文本,这会稀释搜索结果。那么,在
Solr
中
索引
/
存储
之前
,如何
删除
"content"-field
中
的
tag-content?有没有关于updateRequestProcessorChain
的
方法?有人知道解决方案吗?
浏览 5
提问于2017-08-15
得票数 0
回答已采纳
1
回答
在
Solr
中
存储
原始HTML文件
、
、
、
、
我有
Solr
5.4.1,我正在尝试
索引
和
存储
html文件。我想
存储
原始
的
HTML,以便我可以使用它来突出显示。提前感谢
浏览 3
提问于2016-02-11
得票数 0
1
回答
从
内容
中
筛选HTML标记仅用于搜索,而不是在
Solr
中
显示
、
、
、
我
的
源数据中有一个名为Overview
的
内容
字段
,
存储
在
Solr
中
的
一个名为tm_overview
的
文本
字段
中
(为什么它是多值
的
,我不知道,但它是在我到达
之前
完成
的
),这是一个标准文本
字段
。我遇到了一个问题,在搜索过程
中
,从HTML
标签
中找到数字和文本。该
字段
同时将index
浏览 0
提问于2018-07-25
得票数 0
回答已采纳
1
回答
架构更改是否需要重新
索引
所有
Solr
文档,还是只需要包含更改
的
架构
字段
的
文档?
、
、
我
的
Solr
索引
中有数百万份文档。这些文档
中
只有1000个有
字段
A,我想更改它
的
架构。模式更改包括将multiValued从true更改为false,从false
存储
到
true,并从文本
到
字符串键入需要重新
索引
的
内容
。重新编制上千个文档
的
索引
将花费我几分钟
的
时间,因为重新编制
索引
需要几天时间。
Solr
浏览 4
提问于2014-04-14
得票数 5
回答已采纳
2
回答
当使用
存储
的
html
字段
突出显示时,
Solr
Solr
html
、
、
我使用如下
的
字段
类型在html
字段
上进行搜索: <analyzer"/></fieldType> 然后,我执行搜索并使用
存储
的
字段
,以便可以在结果<em
浏览 0
提问于2013-01-26
得票数 2
2
回答
在
solr
中
索引
和访问odt文件
、
、
、
、
如
何在
存储
在
solr
_home目录
中
的
odt文件中发布、
索引
和搜索
内容
?我尝试了理解和应用下面提到
的
页面,并在模式
中
包含了一个body
字段
: resourcename
字段
包含文件位置,但content
字段
为空。但是,我仍然无法搜索文件
内容
,即使它显示文件已经
索引
并提交了更改。对于这样
的
要求是否有任何端
到
端<
浏览 6
提问于2014-02-27
得票数 0
回答已采纳
1
回答
solr
中
的
apache nutch结果
索引
、
、
、
、
我想用Nutch抓取网站,然后在
Solr
中
索引
结果。 我在
solr
schema.xml文件
中
,想象一下,在这个文件
中
,我有
字段
内容
。但是每个站点都有自己
的
模式,例如在一些站点中,我想在"content filed(in
solr
schema)“
中
设置"body”
标签
,而对于另一个站点,我想在"content filed(in
solr</e
浏览 2
提问于2016-02-15
得票数 0
1
回答
没有html
标签
的
查询
solr
?
、
我已向
Solr
发送了以下数据: "id":"kkk",}<field name="name" type="text_html" indexed="true" stored="tru
浏览 6
提问于2017-04-27
得票数 0
回答已采纳
1
回答
Solr
令牌程序不做任何事情。
、
我想将一个
solr
字符串
字段
"content“标记为另一个
字段
"tokenized”。<fieldType name="customType" class="
solr
.TextField"> <tokenizer class="
solr
.StandardTokenizerFactory"/> <filter cl
浏览 4
提问于2022-06-30
得票数 0
回答已采纳
3
回答
solr
从
索引
中排除html类
、
、
我用
solr
索引
知识库。问题是,菜单也是
索引
的
,所以搜索菜单中使用
的
术语会返回所有页面。HTML标记被移除,所以我以后找不到指定
的
元素。编辑:也就是说,从
索引
中排除某些html节点(比如我
的
导航)。</p> </main>
浏览 0
提问于2015-08-31
得票数 2
回答已采纳
2
回答
SOLR
单元如何添加文档
内容
?
、
SOLR
有一个名为Cell
的
模块。它使用Tika从文档中提取
内容
并使用
SOLR
对其进行
索引
。我
的
SOLR</e
浏览 4
提问于2016-10-31
得票数 0
回答已采纳
1
回答
Solr
字段
名规则?
、
、
很抱歉问到纽比
的
问题,我是新来
的
。在托管模式
中
,我发现有许多类型相同但名称不同
的
字段
。如果类型都相同,但只有名称不同,
Solr
如何标识要
存储
令牌
的
字段
?<field name="content_type_hint" type="text_general"> <field name="blitz" type="text_general"&g
浏览 0
提问于2018-04-14
得票数 1
回答已采纳
2
回答
Solr
是否在
索引
后
存储
文档
的
原始
内容
?
、
如果我将一个
字段
标记为“不
存储
”,
Solr
是在任何地方保留该
字段
的
原始
内容
,还是只保留它为
索引
本身挑选
的
“词袋”? 我是从文档安全
的
角度提出这个问题
的
。如果有人入侵了运行我们
的
Solr
索引
的
机器,他们能不能得到传递
到
Solr
中
的
“不要
存储
”
字段</e
浏览 0
提问于2012-04-19
得票数 2
回答已采纳
1
回答
您如何配置ApacheNutch2.3以表彰机器人metatag?
、
、
、
、
我有一个以HBase为后端
的
Nutch2.3设置,并运行了一个爬行,其中包括
Solr
和
Solr
的
索引
。 在网上搜索答案时,我
浏览 1
提问于2016-02-05
得票数 2
回答已采纳
1
回答
如何利用lucene/
solr
同时从数据库和doc文件导入记录进行关联
、
、
我将二进制文档信息(文件元)
存储
在数据库
中
,将二进制文档
存储
在文件系统
中
。使用与数据库
中
的
文件信息相关联
的
文件名。现在,我想将所有这些数据(二进制文档
中
的
文件元和全文
内容
)导入
到
lucene
solr
中
。 lucene/
solr
提供了“使用数据导入处理程序(DIH)从数据库导入记录”。和“
索引
二进制文档,
如</
浏览 3
提问于2012-05-03
得票数 1
1
回答
为什么
Solr
存储
字段
的
原始/预分析
内容
,而不仅仅是它
的
索引
?
、
这个问题在某种程度上表明,我对
Solr
和它
的
所有奇妙功能都是新手。我为我
的
傲慢道歉。它将原始
内容
存储
在哪里?它是否以某种方式引用了实际
的
文档?另外,有
浏览 7
提问于2016-09-06
得票数 0
回答已采纳
2
回答
java - MongoDB +
Solr
性能
、
、
在我
的
应用程序
中
,我将有大量
的
文档
存储
在MongoDB
中
(可能高达数亿),我希望对这些文档
的
某些属性实现全文搜索,所以我认为
Solr
是最好
的
方法。我想知道
的
是,我应该如何配置/执行一切,使其具有良好
的
性能?现在,我要做
的
事情是(而且我知道这不是最佳
的
): 1-在MongoDB
中
插入对象时,我将其添加到
Solr
中
。,由于
浏览 6
提问于2011-08-25
得票数 24
回答已采纳
1
回答
如何
删除
SOLR
索引
[ content
字段
]
内容
中
的
脚本和样式,同时通过URL进行
索引
?
、
、
每当
Solr
被
索引
为集合(使用configSet sample_techproducts_configs)并使用URL时,通过以下命令:创建
的
索引
有一个
字段
content复制
到
text
字段
。此
字段
具有使用嵌入式tika解析
的
网页
内容
的</
浏览 2
提问于2017-04-07
得票数 0
回答已采纳
2
回答
为什么Dismax在简单查询
中
不起作用?
、
全部:当我使用不带dismax
的
基本查询时: http://localhost:8983/
solr
/collection1/select?q
浏览 12
提问于2015-03-31
得票数 0
1
回答
indexed=true与stored=true
的
SOLR
差异
、
在
SOLR
中
,stored=true和indexed=true
的
区别是什么?我知道stored=true在不修改
字段
的
情况下
存储
字段
的
实际值,而indexed=true为计算目的
存储
字段
的
修改值。我想知道,它对演出有多大
的
影响。与stored=true和indexed=true相比,indexed=true和stored =false
的
组合是否降低了持久性和检索性
浏览 1
提问于2015-03-02
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
全文检索之Solr7.4服务器
搜索系统,原来可以这么简单
Elasticsearch对垒8大竞品技术,孰优孰劣?
量数据搜索——搜索引擎
Elasticsearch如何检索数据
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券