腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
Java
Stanford NLP:查找词频?
java
、
nlp
、
stanford-nlp
给定词典中的一个
单词
,我如何找到它的
频率
*?或者,给定一个
频率
等级,我如何确定相应的
单词
? *在整个语言中,而不仅仅是文本样本。
浏览 0
提问于2009-11-30
得票数 2
3
回答
Apache Pig字数
统计
程序
apache-pig
在
单词
统计
程序中,如何找出猪出现
频率
最高的
单词
和出现
频率
最低的
单词
。如何在这里使用MAX函数。(纳维恩,3) (is,5) 这里我需要的输出是" is“
浏览 34
提问于2016-07-24
得票数 0
1
回答
gensim:在doc2vec词汇表中检索词频
dictionary
、
word2vec
、
gensim
、
doc2vec
、
vocabulary
我刚刚在doc2vec模型词汇表中遇到了的
单词
统计
。我想知道是否有其他方法可以检索
单词
频率
,而不是 print(str(word) + str(vocab_obj.count)) 也许有一种更好的方式通过gensim库(即在txt文件中输出
单词
和
频率
)?
浏览 20
提问于2018-01-30
得票数 0
3
回答
Mapreduce字数
统计
Hadoop最高频字
java
、
hadoop
、
mapreduce
、
word-count
因此,从Hadoop教程网站()了解如何使用map reduce方法实现
单词
计数,我了解了它是如何工作的,并且输出将是具有该
频率
的所有
单词
。我想要做的只是让输出成为我所拥有的输入文件中出现
频率
最高的
单词
。Example: Jim Jim Jim Jim Tom DaneJim 4 字数
统计
的当前输出是每个
单词
及其
频率
。有没有人编辑过字数
统计
,让它只打印最高
频率
的
单词
及其
频
浏览 0
提问于2015-03-06
得票数 2
1
回答
在apache-beam中写入多个Kafka主题?
apache-kafka
、
apache-beam
、
apache-beam-kafkaio
我正在执行一个简单的
单词
统计
程序,其中我使用一个Kafka主题(生产者)作为输入源,然后应用pardo来计算
单词
计数。现在我需要帮助写
单词
到不同的主题的基础上,他们的
频率
。让我们说所有
频率
为偶数的
单词
将转到主题1,其余的将转到主题2。 有没有人能帮我举个例子?
浏览 7
提问于2020-07-07
得票数 0
2
回答
如何用python对英语
单词
进行分类?
python
如何用python对英语
单词
进行分类?比如国家和政府:政权,政治,政治家,官员,democracy......besides,还有其他的话题:教育/家庭/经济/学科等等。我想整理“经济学人”杂志的词汇,并根据
频率
和主题对这些进行分类。目前,我已经完成了
单词
的
频率
统计
,下一步是如何用python自动对这些
单词
进行分类?
浏览 9
提问于2020-04-14
得票数 0
1
回答
如何在R中
统计
我的csv文件中特定
单词
的出现
频率
?
r
、
tm
在我的csv文档中只有评论(只有行,没有列).I想要
统计
单词
的出现
频率
,例如,like,从我的csv文件中最好。我不想要每个
单词
的
频率
。我只想知道这三个
单词
在我的csv文档中出现的次数。我尝试了这些代码,但它给了我每个我不想要的
单词
的
频率
。有没有人能帮我解决如何
统计
特定
单词
或特定
单词
列表的
频率
? texts <- read.csv(".
浏览 2
提问于2018-06-28
得票数 0
2
回答
是否可以使用c++中的unique命令来获取
频率
c++
、
vector
我想要得到存储在向量中的
单词
的
频率
。我已经谷歌了我的问题无数次,但没有去一些对我有用的东西。我找到了一个站点,有人说要使用unique命令来
统计
单词
的
频率
,但我找不到任何示例来说明如何做到这一点。
浏览 3
提问于2012-03-08
得票数 1
回答已采纳
4
回答
词性标注-从哪里开始?
java
、
parsing
、
nlp
、
linguistics
我想收集有关
单词
频率
的
统计
数据,但另外要确保每个
单词
都被正确识别(或大多数
单词
)。让我们说,“绿草”,“漂亮女孩”,“小心处理”,“你是对的”。这样我们就可以准确地说出,在语言中经常一起使用的
单词
序列是什么。有没有开放的
Java
工具&关于这个主题的好书?
浏览 3
提问于2010-02-05
得票数 0
2
回答
如何使用python查找文本文件中
单词
的出现
频率
?但是用户应该给出输入词
python
、
python-3.x
我的目标是:
统计
用户在文本文件中输入
单词
的
频率
。(在python中)我尝试了this.But,它给出了file.How中所有
单词
的
频率
。我可以修改它来给出用户输入
单词
的
频率
吗?
浏览 28
提问于2020-03-30
得票数 0
回答已采纳
5
回答
统计
每个
单词
的出现
频率
c#
、
.net
、
c#-4.0
、
.net-4.0
、
word-frequency
如何
统计
每个文件中每个
单词
的出现
频率
?
单词
是指一组字符,可以包含字母、数字和下划线字符。
浏览 1
提问于2012-03-30
得票数 3
回答已采纳
1
回答
为什么不是所有的二元语法都在gensim的‘`Phrases`’工具中创建?
python
、
nlp
、
gensim
、
n-gram
、
word-embedding
我使用gensim创建了一个二元模型,并尝试获取二元句子,但它没有选择所有的二元句子,为什么?phrases = Phrases(sentences, min_count=1, threshold=1)sent = [u'the', u'mayor', u'of', u'new', u'york', u'was', u'th
浏览 10
提问于2020-02-07
得票数 1
回答已采纳
1
回答
Python -找出文本文件中每对可能的
单词
在同一行中出现的
频率
的最有效方法?
python
、
dictionary
、
compare
、
line
、
statistics
要浏览一个大文件,收集(整个文件)两个
单词
在同一行中出现的
频率
的
统计
数据,最好的方法是什么?“这是白色棒球。”“这些家伙有白色的棒球棒。”您将最终收集以下
统计
信息:(this,is: 1),(this,the: 1),(this,白色: 1),(this,棒球: 1),(is,the: 1),(is,白色: 1),(is,棒球: 1)……对于条目(棒球,白色: 2),该值将为2,因为这对
单词
在同一行中总共出现了2次。理想情况下,
统计
信息应该放在字典中,其
浏览 0
提问于2010-10-02
得票数 2
回答已采纳
1
回答
列出标题的最简单的方法?
nlp
我在这里的深度太大了--希望这篇文章没问题。我有1000条左右的标题。我试图找出标题是关于同一件事,但措辞不同。
浏览 7
提问于2022-05-23
得票数 2
1
回答
如何
统计
java
文档中
单词
的出现
频率
?
java
、
arrays
我是
Java
的初学者,我有一个程序可以计算多个文档中的字数作为数组,然后给出输出,在一个新文件中以某个帐户的名称创建。我已经使用了下面的函数,我可以用其他更简单的函数来替换它吗?
浏览 1
提问于2017-01-25
得票数 1
1
回答
概率与大小成比例的随机样本
r
、
stat
我在一个
统计
项目中,我有一个表,其中包含
单词
和每个
单词
在文本中的
频率
,我想要的是一个样本,其中包含
频率
最高的
单词
你好,下午好,我希望有人能帮助我。我有一个表,里面有
单词
,以及每个
单词
在文本中出现的
频率
。
浏览 0
提问于2019-07-11
得票数 0
1
回答
按值对字典进行排序
python
我从一堆或电子邮件中读取数据,并计算每个
单词
的
频率
。首先构造两个计数器:counters.chi = collections.counter()气的关键是与
统计
中的词相同的词。我想按“chi.‘”中的键对“stats”中的键进行排序。
浏览 0
提问于2012-05-05
得票数 1
回答已采纳
1
回答
如何从包含2个元组的列表中的最后一个条目中检索第二个值?
scala
、
map
、
tuples
我使用map扫描输入文件并生成字数
统计
。映射键是
单词
,值是
单词
的出现次数。我将映射转换为列表,并按值升序排序。因此,我有一个包含2个元组的列表,出现
频率
最低的
单词
在列表的第一个位置,出现
频率
最高的
单词
在列表的最后一个位置。
浏览 2
提问于2012-09-27
得票数 0
回答已采纳
2
回答
使用前十名从collections.counter中排除
单词
python
、
collections
、
counter
我想通过使用以下命令来
统计
某些文档中使用的
单词
的
频率
:我无法简单地将.subtract( exclusion_list )添加到此命令中,其中exclusion_list是我不想要的
单词
列表。如何才能在不包含排除列表的情况下获得前十个
单词
?
浏览 3
提问于2015-04-15
得票数 2
1
回答
检查开放式问题的n-
单词
频率
r
、
text-mining
、
tm
首先是
单词
云,然后我遇到了一个问题,当我想
统计
2-3个
单词
短语的
频率
时。TermDocumentMatrix(corpus,control=list(tokenize=tokenize_ngrams))结果应该是2个
单词
的短语和
频率
浏览 2
提问于2017-07-18
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Hamlet单词统计
Python实现文本单词统计
mapreduce单词统计理解核心思想
【C语言程序设计】C语言统计单词个数,单词个数算法
Java编程 常用英语单词
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券