腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(633)
视频
沙龙
1
回答
修改
现
有的
Solr
7.6.0
/
Lucene
索引
(
在
已
建立
索引
的
文件
(.
pdf
、.
docx
等
)
中
添加
另一个
字段
'
URL
‘)
indexing
、
solr
、
lucene
我有一个
Solr
7.6.0
Lucene
索引
(很多.
pdf
,.
docx
和.xlsx
文件
)
索引
是
在
命令窗口中使用post命令创建
的
,指向
文件
所在
的
目录共享(映射
文件
路径)。还有一个文档
的
web
URL
,我
在
一个数据库
中
,
Lucene
目前对此一无所知。我想用这个
URL</
浏览 17
提问于2019-02-22
得票数 0
回答已采纳
1
回答
在
Solr
4
中
-如何在
索引
中
包含
文件
名?
solr
、
lucene
、
schema
、
xsd
、
solr-schema
我正在使用
Solr
4.8.1构建一个搜
索引
擎-在这样做
的
时候,我试图
在
我
的
GUI搜索结果
中
显示每个
索引
文档
的
文件
名。我可以成功地显示
Solr
的
Schema.xml
文件
中
的
任何
字段
(标题、作者、id、资源名称last_modified
等
)。但是,我
在
schema.xml
中
找不
浏览 5
提问于2014-06-27
得票数 2
2
回答
Hadoop来创建一个
索引
,并将它
添加
到分布式
SOLR
中
。这个是可能
的
吗?我该用Nutch吗?..Cloudera?
solr
、
hadoop
、
nutch
、
solrnet
、
faceted-search
我可以使用MapReduce框架创建
索引
并以某种方式将其
添加
到分布式
Solr
中
吗? 将该
文件
部署到所有
Solr
实例
中
。一旦我选择了MatpReduce框架,我需要标记文档(
PDF
、
DOCx
、DOC
浏览 2
提问于2010-11-21
得票数 2
回答已采纳
2
回答
如何在
lucene
中
查询整数、浮点数以及如何存储(NumericComparator)?
solr
、
lucene
一个更大
的
问题是
solr
是否能够支持这一点?我知道我见过
lucene
能做到这一点,
solr
是
建立
在
lucene
的
基础上
的
。基本上,我正在尝试一个noSQL orm解决方案,它提供
索引
(
在
github上)(虽然客户端决定每个表
的
索引
数量和分区方法,但是您可以
在
索引
中
添加
实体并自己删除它们,并且可
浏览 5
提问于2012-05-01
得票数 5
回答已采纳
2
回答
solr
对
索引
处理做了什么?
solr
、
lucene
、
information-retrieval
所以我对信息检索有一定
的
了解。但我不清楚
solr
在
索引
方面做了什么。我知道
solr
正在使用
lucene
进行
索引
。那么,
solr
是对每个文档进行倒排
索引
,还是仅仅使用每个文档
的
id进行
索引
?
浏览 0
提问于2014-06-18
得票数 0
1
回答
使用
Solr
6.4.1上
的
亮点
solr
、
lucene
、
highlight
我
在
Windows7机器上运行
Solr
6.4.1,目前使用Chrome测试查询
URL
。我没有以任何方式
修改
模式-只是将
文件
夹
索引
到名为test
的
Core
中</em
浏览 0
提问于2017-02-10
得票数 0
1
回答
部分更新
文件
solr
、
search-engine
、
elasticsearch
、
linkedin
我们要求我们目前
在
SOLR
中
索引
的
文档可能需要定期进行部分更新。更新可以是a.
添加
新
字段
b.更新现有
字段
的
内容。我们模式
中
的
一些
字段
是存储
的
,另一些则不是。
SOLR
4确实允许这样做,但是必须存储所有
字段
。见和 问题: 1.
SOLR
有什么方法可以做到这一点?我们过去曾尝试过
SOLR
联接,但它
浏览 2
提问于2013-03-01
得票数 3
回答已采纳
1
回答
需要在其中一个
solr
字段
中使用
URL
(超链接
solr
我正在尝试用TIKA对
PDF
文档进行
索引
。我正在使用org.apache.
solr
.common.SolrInputDocument()向文档
添加
不同
的
字段
,如id、title、author、
url
。
在
URL
字段
中
,我给出了要
索引
的
文件
的
路径。当前我
的
本地系统路径: C:/Users/abc
浏览 0
提问于2015-07-28
得票数 0
1
回答
在
SOLR
中
,“文档”和“核心”是什么意思?我该怎么用呢?
php
、
search
、
solr
基于关系数据库
的
类比,我想知道
Solr
是如何合适
的
。根据我到目前为止
的
计算结果,
Solr
中
的
“文档”与sql
中
的
“行”类似(如果我
的
sql表有100行,我需要在
solr
中
插入100个文档),而“核心”类似于“表”(或数据库?!)。或者我做了一个核心(core_general),并在那里插入两个表
中
的
所有文档(以某种方式分离,我不知道如何分开)。<
浏览 1
提问于2013-10-19
得票数 4
回答已采纳
2
回答
将
solr
1.4
索引
升级到
solr
3.3?
solr
、
indexing
、
luke
我有一个使用apache
solr
1.4
的
现有
索引
构建。 我想在3.3版中使用这个现
有的
索引
。正如您所知道
的
,
索引
格式
在
3.x之后发生了变化,那么如何才能做到这一点呢?我已经使用Luke to XML导出了现
有的
索引
(即1.4版本)。
浏览 3
提问于2011-07-11
得票数 7
回答已采纳
8
回答
全文搜
索引
擎
的
比较-
Lucene
,Sphinx,PostgreSQL,MySQL?
云数据库 SQL Server
、
postgresql
、
django
、
搜索引擎
、
sphinx
我正在开发一个Django网站,关于搜
索引
擎我有以下选择:
Lucene
/
Lucene
with Compass/
Solr
Sphinx PostgreSQL MySQL 选择标准: 通过结果相关性排序检索速度 易于使用,易于与Django集成 资源需求:站点将托管
在
VPS,因此理想情况下,搜
索引
擎不需要大量
的
RAM和CPU。可伸缩性 额外
的
功能,相关搜索 有什么好
的
建议? 注:对于用户实时输入
的
浏览 1608
提问于2018-02-07
回答已采纳
5
回答
实现搜索文档(
PDF
、XML、HTML、MS Word)
的
最佳方法是什么?
java
、
search
、
pdf
、
ms-word
在
java web应用程序
中
编写用于搜索文档
的
搜索功能
的
好方法是什么? “带标签
的
搜索”适合这样
的
搜索功能吗?
浏览 0
提问于2009-05-06
得票数 1
回答已采纳
3
回答
从
Solr
中
检索Magento产品信息
magento
、
solr
我遵循了这里描述
的
步骤: 设置工作正常,产品被推送到
solr
,我可以通过REST API检索它们。但是,我可以从
solr
中
检索
的
字段
只有: status、timestamp、store_id、id、short_description、sku、in_stock、name、in_stock、description_en根据schemas.xml,我应该能够获得以下额外
的
字段
:"visibility","show_in_cate
浏览 1
提问于2011-10-23
得票数 2
3
回答
使用
Lucene
搜索一次搜索多个
索引
zend-framework
、
search
、
lucene
我正在使用Zend_Search_
Lucene
来实现站点搜索。我为不同
的
数据类型创建了不同
的
索引
(例如,一个用于用户,一个用于帖子
等
)。结果同样是按数据类型划分
的
,但是有一个“all”选项,它应该显示不同结果类型
的
组合。是否可以一次跨不同
的
索引
进行搜索?或者我必须在all
索引
中
索引
所有内容?更新:ZF1.8
的
表明现在可以
在
ZF1.8
中</
浏览 2
提问于2009-04-01
得票数 3
回答已采纳
3
回答
Solr
search -如何防止位置散列
中
的
重复项
search
、
solr
、
lucene
、
nutch
我正在从一个抓取
的
内部站点中获取结果。问题是我得到了多个结果,因为
在
代码中使用了位置散列:http://site.com/en/personal/refunds.htmlsite.com/en/personal/refunds.html#content http://site.com/en/personal&
浏览 0
提问于2013-02-06
得票数 0
回答已采纳
2
回答
开始使用
Solr
solr
、
lucene
、
full-text-search
通过阅读,我已经设置了一个正在运行
的
Solr
实例。我感到困惑
的
是,
Solr
(模式
等
)
的
所有配置都是XML格式
的
。当它们
添加
示例数据时,将展示如何
添加
xml (java -jar post.jar
solr
.xml monitor.xml)。这仅仅是样本格式
的
错误选择吗?我
的
意思是,他们是在上传描述文档
的
数据,还是正在
添加
的
实际
浏览 3
提问于2012-02-06
得票数 6
回答已采纳
1
回答
在
Solr
中使用数据导入处理程序编制
索引
时提取
文件
名(不带扩展名)
solr
、
lucene
、
solr4
、
apache-tika
我可以使用
solr
4.3.0
中
的
数据导入处理程序成功地
索引
pdf
、doc、ppt
等
文件
。(DOC)|(
PDF
)|(
pdf
)|(doc)|(
docx
)|(ppt)|(pptx)|(xls)|(xlsx)|(txt)" onError="skip" recursive=<entity name="tika-test" dataSource=
浏览 0
提问于2013-07-03
得票数 1
回答已采纳
3
回答
有效过滤/搜索
mysql
、
search
、
lucene
、
filtering
、
saas
我们有一个管理内容页
的
托管应用程序。每个页面可以有许多自定义
字段
,以及一些标准
字段
(时间戳、用户名、用户电子邮件
等
)。基本上,我想知道其他大型网站是如何做到这类事情
的
浏览 4
提问于2008-11-19
得票数 5
回答已采纳
2
回答
SOLR
/
LUCENE
专家,请帮助我设计一个简单
的
关键字搜索从
PDF
索引
?
pdf
、
lucene
、
solr
、
full-text-search
、
keyword
我试过索尔,但想不出一种适合我
的
要求
的
方法。一堆
PDF
文件
。一组关键词。我想要达到
的
目标:尝试操作ResponseHandler
Lucene
/
solr</
浏览 1
提问于2011-08-02
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
全文检索之Solr7.4服务器
搜索系统,原来可以这么简单
量数据搜索——搜索引擎
Django全文检索实现:基于HayStack+Whoosh引擎+Jieba中文分词
Django实战-番外篇-haystack全文检索
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券