腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
5
回答
Java
中是否有用于文本
分析
/挖掘的API?
、
、
、
、
我想知道
Java
中是否有可以进行文本
分析
的API。可以提取文本中的所有
单词
、单独的
单词
、表达式等的东西。可以通知找到的
单词
是数字、日期、年份、名称、货币等的东西。我现在正在开始文本
分析
,所以我只需要一个API就可以启动了。我做了一个网络爬虫,现在我需要一些东西来
分析
下载的数据。需要方法来计算页面中的
单词
数量,相似的
单词
,数据类型和其他与文本相关的资源。
Java
中有用于文本
分析
的API吗? 编辑:文本
浏览 2
提问于2011-07-23
得票数 25
回答已采纳
1
回答
如何使用
java
分析
elasticsearch中的文本?
、
我使用Elasticsearch 1.7.4和它的
Java
。目前,我想计数前10个高频搜索词的用户。因此,我必须记录用户要搜索的查询文本中的
单词
,而在记录这些
单词
之前,我必须
分析
查询文本。正如所说,我找到了
分析
文本的restful方法,但在TransportClient中找不到api。有人知道如何使用
Java
或其他方式来
分析
elasticsearch中的文本,而不是请求restful吗?
浏览 2
提问于2016-01-27
得票数 2
回答已采纳
1
回答
按字母/元音进行
单词
翻译
、
、
、
、
我想按字母/元音来翻译
单词
。我会试着解释的。我有一个大约300,000字的阿拉伯语文本,我的目标是使用户能够使用我定义的10种语言中的一种来搜索文本。
浏览 0
提问于2012-03-20
得票数 0
回答已采纳
1
回答
仅当令牌长度大于X个字符时应用Solr过滤器
我只想在令牌长度超过X个字符的情况下应用词干
分析
,这在Solr中是可能的吗?我知道有一个可用的<filter class="solr.LengthFilterFactory" min="2" max="7"/>,但它只会删除不符合它的条件的
单词
,而不是让它们绕过词干。
浏览 0
提问于2017-03-17
得票数 0
1
回答
词法:获取给定英语
单词
的词根和后缀的工具
、
、
、
、
我正在尝试在词性标注中做变形
分析
。如果我输入:‘like’,我想得到输出:like,edprint(porter_stemmer.stem(&quo
浏览 22
提问于2014-09-18
得票数 3
1
回答
如何在ElasticSearch中索引此字段?
、
、
、
我想对以下字段进行索引:因此,对所有三个
单词
的搜索,无论是按任何顺序排列,都会出现,而对其中几个
单词
的搜索(比如“棕狐”)就会漏掉。
浏览 3
提问于2013-07-17
得票数 2
回答已采纳
2
回答
如何使用StanfordNLP package进行依赖
分析
?
、
、
我正在尝试使用的新的基于NN的解析器来查找句子中的所有形容词短语(例如,good和The weather is extremely good中的extremely good ),但是,它非常缺乏文档,我无法让它工作。我目前的代码是nlp = stanfordnlp.Pipeline()doc.sentences[0].print_dependencies()('The', '2', 'det'
浏览 1
提问于2019-03-11
得票数 3
回答已采纳
1
回答
在scala中导入自定义
java
类
、
、
我是Scala的新手,事实上,我对
Java
也很无知(我对我的
Java
知识不感兴趣)。问题是,我使用的是
Java
API,它只适用于
Java
( Freeling )。现在,我创建了一个
java
类调用
分析
器,它只使用一个静态的公共方法调用
分析
,它接受一个
单词
字符串(一个句子的所有部分),并返回一个字符串的
java
.util.ArrayList,其中每个字符串都有这个句子中每个
单词
的
单词
现在,我知道您可
浏览 4
提问于2014-02-20
得票数 1
回答已采纳
1
回答
Solr :使用Solr对
单词
进行词干提取
、
、
我将把
单词
传递给solr,它应该将词干提取的
单词
发回。我知道如何为不同的词干提取模式配置solr核心,我也能够在
分析
器(solr管理ui)中查看它们的词干提取的
单词
,但我不确定如何使用
java
代码来实现这一点。我能够使用
java
api进行索引和查询。
浏览 1
提问于2015-09-03
得票数 1
2
回答
简
单词
法
分析
java
程序
、
、
我的小项目是一个词法
分析
程序,在这个程序中,我必须获取在任意.
java
文件中找到的每个
单词
,并列出它在文件中出现的每一行。我需要有一个查询表专门为保留字和另一个在文档中找到的所有额外的字。我只是想把掌握
java
语言作为一种爱好,所以只要我能理解发生了什么,所有的帮助都是欢迎的。我确信这个问题有一个简单的解决方案,但我的尝试没有奏效:(感谢您的帮助^^import
java
.io.FileNotFoundException; import
浏览 2
提问于2012-01-17
得票数 4
5
回答
我想要一个
Java
阿拉伯语词干
分析
器
、
、
、
我正在找一个阿拉伯语的
Java
词干
分析
器。我找到了一个名为"AraMorph“的库,但它的输出是不可控的,并且它对不需要的
单词
进行构造。 有没有其他的阿拉伯语词干
分析
器?
浏览 0
提问于2011-07-12
得票数 9
1
回答
elasticsearch spring未返回完全匹配
、
、
我在
Java
API上使用elastic search进行全文搜索。目标是将查询字符串的每个
单词
与字段(运算符和)匹配,并能够识别和匹配
单词
的复数形式。(我的文档是法语的)QueryBuilders.matchQuery("field",queryValue) 此代码可以查找
单词
的单个或复数形式,但返回与queryValue中的一个
单词
匹配的所有结果。QueryBuilders.mathcQuery("field",queryVa
浏览 13
提问于2016-07-27
得票数 0
1
回答
用于文本边界
分析
的资源
、
我需要在我的项目中做“文本边界
分析
”。 顺便问一下,有没有其他资源可以帮助进行文本边界
分析
?(Alex Martelli:我试过ICU和
Java
,但他们找不到任何一种东方语言的
单词
。) (dwc :非常感谢,这可能会有所帮助。)
浏览 1
提问于2009-05-28
得票数 0
3
回答
Lucene搜索日语字符
、
、
我已经为我的应用程序实现了lucene,它工作得非常好,除非你引入了像日文字符这样的东西。lucene中是否支持日语字符?要进行哪些设置才能使其正常工作?
浏览 3
提问于2010-04-15
得票数 7
回答已采纳
1
回答
波兰搜索狮身人面像?
、
、
、
、
我想为一个用Django编写的网站实现一个搜索解决方案。从可用的选项(我已经研究过Solr、Sphinx、Xapian、PostgreSQL/Tsearch3、MySQL)中,Sphinx看起来是最好的。然而,它不支持波兰语的词干,这是我想要使其可搜索的数据语言。
浏览 0
提问于2011-02-04
得票数 5
1
回答
推特趋势:如何获取前100名最常用的
单词
?
对于一个研究项目,我需要下载推特上最常用的100个
单词
,每小时多次。然而,据我所知,只支持下载十大最常用的
单词
(“趋势”)。 我是不是漏掉了API里的东西?
浏览 4
提问于2011-03-23
得票数 0
2
回答
什么是解析?我们如何在j2me中实现它?
、
什么是解析?我们如何在j2me中实现它?
浏览 0
提问于2010-09-10
得票数 0
1
回答
java
中的智能字符串解析
、
、
、
、
我有一个电子邮件主题行,我需要
分析
。我需要找到在一个
单词
列表中给出的任何
单词
的第一次出现,并得到下一个
单词
,这个
单词
可以被" Order“、"auftrag”、"auftragsnummer“、”auftragnr“的
浏览 0
提问于2014-03-11
得票数 0
2
回答
使用crawler4j库实现
Java
crwaler中模式匹配的一些信息
、
、
、
我想用
Java
实现一个非常简单的web爬虫,我已经找到了这个库: crawler4j:从URL开始(由我指定),并识别当前页面中是否有一个特定的
单词
,比如自己的名称或公司名称(这个词也是由我指定的) 如果找到这个
单词
,则必须将当前页面URL保存在数据库中。因此,没有语义
分析
,只有语法
分析
(爬虫必须尝试将网页内容与我指定的标记匹配)。我会知道这个令牌研究(如果在当前页面中包含一个
单词
)是由抽象类WebCrawler of crawler4j实现的,还是我必须
浏览 4
提问于2013-02-21
得票数 0
回答已采纳
1
回答
Java
pdf小丑与apache pdf方框
、
、
我在一个商业程序中寻找一个免费的
Java
库来
分析
pdf。 哪个库可以通过统计不同的
单词
和检测标题来在pdf中进行数据挖掘?
浏览 1
提问于2015-07-25
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Java编程 常用英语单词
56组Java必背英文单词
这70个Java必背英语单词不会,就别说你是Java程序员
这70个Java必背英语单词不会,就别说你是Java程序员!
这70个Java必背英语单词都不会,就别当Java程序员了
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券