腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Lucene
SpanQueries
会
自动
标记
化
吗
,
还是
我
必须
自己
对
查询
进行
标记
化
?
我
正在使用标准分析器来存储信息,这些信息在特殊字符上
进行
标记
,并删除诸如“the”之类的停用词。
我
的问题是: (1)如果
我
做了一个SpanQuery,
我
搜索了“最好的东西”,但是没有存储单词" the“,
我
需要编写代码来取出这个单词,所以我只搜索”最好的东西“,
还是
自动
为我处理?(2)
我
是不是也要
自己
处理低成本的问题?
浏览 12
提问于2017-03-16
得票数 0
回答已采纳
1
回答
NLP -在全文搜索中使用语义通配符的
查询
,可能是
Lucene
吗
?
、
、
、
、
假设
我
有一个大语料库(例如英语或任意语言),
我
想
对
它执行一些语义搜索。例如,
我
有一个
查询
:
我
想开发一个能够有效处理这些
查询
的库
我
怀疑解析文本需要某种POS
标记
,但由于我不想
浏览 3
提问于2012-11-25
得票数 0
2
回答
NLP -在全文搜索中使用语义通配符的
查询
,可能是
Lucene
吗
?
、
、
、
、
假设
我
有一个大语料库(例如英语或任意语言),
我
想
对
它执行一些语义搜索。例如,
我
有一个
查询
:艺术 --一些文章的占位符(例如英文的a/ an )、sg、做某事 --一些用于NPs和VP (subjects和谓词)的占位符--
我
想开发一个能够有效地处理这些
查询
的库
我
怀疑解析文本需要某种POS
标记
浏览 0
提问于2012-11-25
得票数 3
2
回答
Lucene
:单个术语中的多个单词
、
假设
我
有一个这样的文档textfield:name website stackoverflowStandardAnalyzer analyzer= new StandardAnalyzer(Version.
LUCENE
_42);Phra
浏览 0
提问于2013-06-06
得票数 0
回答已采纳
2
回答
用于
标记
、云和搜索的最佳数据结构(如StackOverflow)?
、
、
、
我
很想知道Stack Overflow的
标记
和搜索是如何架构的,因为它似乎运行得很好。在各种实体上存储
标记
(如何标准
化
?)搜索具有特定
标记
的项目,构建适用于特定搜索结果Entity_Tag的所有
标记
云,以显示搜索result?中每个项目的
标记
列表。 也许以规范
化
的形式存储
标记
是有意义的,但对于#2、#4和#3的目的来说,它也是以空格分隔的字符串。
浏览 9
提问于2008-10-24
得票数 39
1
回答
使用SVN
进行
配置文件版本控制的最佳实践
、
、
、
、
我
必须
对
一个由四个应用程序组成的项目
进行
版本
化
,每个应用程序都有
自己
的配置文件。此项目
必须
部署到多个客户,并通过修改配置文件为每个客户
进行
自定义。
对
不同客户的配置文件
进行
版本
化
的最佳实践是什么?每个客户的整个项目的分支或
标记
(每个客户都有
自己
修改的配置文件)
还是
项目的主干(最终带有分支和
标记
,由于其他原因而创建)和客户的配置文
浏览 3
提问于2013-04-10
得票数 2
回答已采纳
2
回答
让
lucene
把一个领域中的所有术语作为一个单一的术语来处理。
在
我
的
Lucene
文档中,
我
有一个字段" company“,其中公司名称被
标记
。
我
需要对
我
的应用程序的某个部分
进行
标记
化
。但是对于这个
查询
,
我
需要能够在整个公司字段上创建一个PrefixQuery。示例: 定期
查询
“胸罩”
浏览 4
提问于2009-03-03
得票数 0
回答已采纳
1
回答
Lucene
lemmatization
、
我
正在使用
Lucene
对
Java应用程序中的一些英文文本
进行
索引,
我
需要使用
Lucene
4_1_0
对
它们
进行
列举
化
。
我
已经找到了词干分析(PorterStemFilter和SnowballFilter),但这还不够。 在词汇
化
之后,
我
想使用同义词库
进行
查询
扩展,
Lucene
是否也包含同义词库?如果不可能,
我
将
浏览 1
提问于2014-02-11
得票数 2
3
回答
Lucene
索引:解释存储和索引模式
我
想我
还是
不理解
lucene
索引选项。Store.Yes
我
不知道什么是规范。如何存储
标记
化
值? 如果
我
将值"my“存储在"
浏览 3
提问于2009-03-16
得票数 45
回答已采纳
2
回答
带空格的
lucene
通配符
查询
、
、
我
有
Lucene
索引,其中有城市名称。假设
我
想搜索“新德里”。
我
有字符串'New Del‘,
我
想要传递给
Lucene
搜索器,
我
希望输出为’新德里‘。如果
我
生成类似Name:New Del*的
查询
,它会给我所有的城市,其中包含'New and Del‘。有没有什么方法可以创建带有空格的
Lucene
查询
通配符
查询
?
我
参考并尝试了几个给出@ 的解决方
浏览 16
提问于2015-12-30
得票数 7
2
回答
如何使用Zend
Lucene
查找相似/相关的文本?
、
、
、
假设
我
需要像stackoverflow一样搜索相关标题,然后在提交新闻之前添加问题或digg.com。有没有办法做这样的搜索?
浏览 0
提问于2010-04-27
得票数 1
回答已采纳
1
回答
在
Lucene
搜索引擎中使用自建方法
、
、
、
、
我
正在寻找一个合适的搜索引擎,
我
可以在其中使用
我
自己
的相似性度量和
标记
化
方法。
Lucene
搜索引擎就是为这个目的而引入的一个很好的引擎,但我对此一无所知。
我
在网上搜索了新版本的
Lucene
搜索引擎的教程,但大多数页面都是几年前的。
我
的一些问题如下: 是否有可能改变相似性度量、
标记
化
和词干提取方法,并使用
Lucene
中的自建类?如果是,怎么做?,我们如何索引关键字搜
浏览 36
提问于2018-06-03
得票数 0
2
回答
通过Java API实现的Alfresco搜索结果与Nodebrowser中的结果不同
、
我
使用的是启用了
Lucene
的Alfresco 4.1。
我
有一个'myfoldertype‘类型的文件夹,名为'one,2’。名称的
标记
化
(默认情况下)处于启用状态。
我
通过
自己
的Java支持的webscript在特定类型的文件夹上按名称
进行
搜索。);
我</
浏览 1
提问于2013-10-31
得票数 1
1
回答
Google like搜索字符串解析为sql
、
、
、
、
假设
我
有一个带有postgres数据库的web应用程序。
我
想添加一个谷歌喜欢搜索字符串(abc+站点:xyz+ size>800 -pqrs)到它。因此,此字符串将生成用于从数据库返回结果的sql。
我
自己
解析/
标记
用户
查询
并生成sql,或者使用
lucene
或postgresql中的tsearch2。还不确定哪种方法更好。但我倾向于
lucene
。如果
我
使用
lucene
,
我
可以在数据库中
浏览 0
提问于2011-11-05
得票数 0
回答已采纳
2
回答
所有这些单词都具有
我
在
Lucene
.This中索引了一个" description“字段,其中包含一本书的描述。如何使用BooleanQuery类在此字段上实现“所有这些单词”功能?
浏览 3
提问于2009-01-10
得票数 0
回答已采纳
1
回答
Solr精确匹配字段升压
、
我
有这样的要求:如果
查询
文本与特定的字段值(标题字段)完全匹配,则结果
必须
是第一个或至少是最小的。所以我需要用精确的匹配来提高结果。
我
的解决方案是将title创建为一个未
标记
化
的字段,这样它将只精确匹配,并使用edismax
查询
来增强title。 还有别的办法
吗
?如何
对
未
标记
化
的字段
进行
索引?那么没有空格上的
标记
化
吗
?
浏览 2
提问于2018-06-04
得票数 0
2
回答
Solr是否可以索引纯文本文件,而不需要
我
通过Tika运行它们?
、
我
只是在Solr的研究阶段,但到目前为止,似乎要索引一个非结构
化
的文本文件,
我
必须
使用Tika将其转换为XML?这是真的
吗
?
我
觉得奇怪的是,
Lucene
可以在不
进行
任何转换的情况下
对
任意文本
进行
标记
化
和索引,但是Solr需要这个额外的步骤来转换为XML。
我
想也许
我
只是错过了什么。
我
正在研究接近实时的全文搜索,每天搜索数百万个文件
浏览 0
提问于2012-08-04
得票数 2
回答已采纳
1
回答
Lucene
标准分析器按周期拆分
、
如何使
Lucene
的标准分析器在‘’查尔?例如,在
查询
"B“时,
我
需要返回"A.B.C”中的B作为结果。
我
需要用标准分析器处理数字的方式来处理数字,因此简单的分析器是不够的。如果
我
可以指定标准的Analyzer在‘’上
标记
化
,那就太好了。char也是。如果
我
必须
用这个小扩展来编写
自己
的记号赋予器,
我
该怎么做呢?谢谢,Nacha
浏览 4
提问于2011-03-14
得票数 7
回答已采纳
1
回答
Elastic Search Analyzer和Facet
、
我
正在为客户评估Elastic Search。
我
已经开始使用API,并成功地创建了索引并将文档添加到搜索中。使用Elastic Search的主要原因是它提供了facets功能。
我
在理解分析器、
标记
器和过滤器以及它们如何与方面相适应时遇到了困难。
我
希望能够使用关键字,日期,搜索词等作为
我
的方面。
我
该如何将Analyzer整合到我的搜索中,以及如何将其与facets结合使用?
浏览 0
提问于2012-06-07
得票数 5
回答已采纳
1
回答
TermQuery不返回已知搜索词,但WildcardQuery返回
、
、
、
我
希望
对
Lucene
内部工作原理有足够洞察力的人能够给我指明正确的方向=)document.Add( new Field("Typenummer", "E5CEB501A244410EB1FFC4761F79E7B7", Field.Store.YES ,
浏览 0
提问于2012-02-24
得票数 7
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
nVisual实现综合布线链路关系记录自动化
综合布线系统运维--现场运维管理移动终端
分词器一定要结合Lucene使用吗
HBase高级用法之行键设计、高级模式、辅助索引、搜索集成、事务、布隆过滤器以及版本管理
Elasticsearch的分段存储思想
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券