首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何使用lucene进行词义化和消去空法字

如何使用lucene进行词义化和消去空法字
EN

Stack Overflow用户
提问于 2017-03-25 22:58:40
回答 2查看 461关注 0票数 1

我在寻找如何在用java语言用lucene编写的法语文档中提取和消除空洞的单词,我在互联网上查看过,但我没有找到好的教程。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-03-26 21:18:27

这很简单,您所需要的只是这样一个FrenchAnalyzer:

代码语言:javascript
运行
复制
IndexWriterConfig conf= new IndexWriterConfig (Version.LUCENE_45,new FrenchAnalyzer(Version.LUCENE_45,FrenchAnalyzer.getDefaultStopSet()));

对于空单词,我们使用: FrenchAnalyzer.getDefaultStopSet(),就像我在前面的代码中所做的那样,对于柠檬化,它已经集成在这个分析器中,您可以注意到,当您查找重要的单词时(通过tf )。

票数 0
EN

Stack Overflow用户

发布于 2017-03-25 23:44:09

“空词”的术语是https://en.wikipedia.org/wiki/Stop_words

Lucene提供了FrenchAnalyzer类,它附带了法语的默认停止单词列表。

用那门课做你的分析器。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43022936

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档