统计单词频率java - 腾讯云开发者社区

文章/答案/技术大牛

发布

2回答

Java Stanford NLP:查找词频？

、、

给定词典中的一个单词，我如何找到它的频率*？或者，给定一个频率等级，我如何确定相应的单词？ *在整个语言中，而不仅仅是文本样本。

浏览 0提问于2009-11-30得票数 2

3回答

Apache Pig字数统计程序

在单词统计程序中，如何找出猪出现频率最高的单词和出现频率最低的单词。如何在这里使用MAX函数。(纳维恩，3) (is,5) 这里我需要的输出是" is“

浏览 34提问于2016-07-24得票数 0

1回答

gensim:在doc2vec词汇表中检索词频

、、、、

我刚刚在doc2vec模型词汇表中遇到了的单词统计。我想知道是否有其他方法可以检索单词频率，而不是 print(str(word) + str(vocab_obj.count)) 也许有一种更好的方式通过gensim库(即在txt文件中输出单词和频率)？

浏览 20提问于2018-01-30得票数 0

3回答

Mapreduce字数统计Hadoop最高频字

、、、

因此，从Hadoop教程网站()了解如何使用map reduce方法实现单词计数，我了解了它是如何工作的，并且输出将是具有该频率的所有单词。我想要做的只是让输出成为我所拥有的输入文件中出现频率最高的单词。Example: Jim Jim Jim Jim Tom DaneJim 4 字数统计的当前输出是每个单词及其频率。有没有人编辑过字数统计，让它只打印最高频率的单词及其频

浏览 0提问于2015-03-06得票数 2

1回答

在apache-beam中写入多个Kafka主题？

、、

我正在执行一个简单的单词统计程序，其中我使用一个Kafka主题(生产者)作为输入源，然后应用pardo来计算单词计数。现在我需要帮助写单词到不同的主题的基础上，他们的频率。让我们说所有频率为偶数的单词将转到主题1，其余的将转到主题2。有没有人能帮我举个例子？

浏览 7提问于2020-07-07得票数 0

2回答

如何用python对英语单词进行分类？

如何用python对英语单词进行分类？比如国家和政府:政权，政治，政治家，官员，democracy......besides，还有其他的话题:教育/家庭/经济/学科等等。我想整理“经济学人”杂志的词汇，并根据频率和主题对这些进行分类。目前，我已经完成了单词的频率统计，下一步是如何用python自动对这些单词进行分类？

浏览 9提问于2020-04-14得票数 0

1回答

如何在R中统计我的csv文件中特定单词的出现频率？

、

在我的csv文档中只有评论(只有行，没有列).I想要统计单词的出现频率，例如，like，从我的csv文件中最好。我不想要每个单词的频率。我只想知道这三个单词在我的csv文档中出现的次数。我尝试了这些代码，但它给了我每个我不想要的单词的频率。有没有人能帮我解决如何统计特定单词或特定单词列表的频率？ texts <- read.csv(".

浏览 2提问于2018-06-28得票数 0

2回答

是否可以使用c++中的unique命令来获取频率

、

我想要得到存储在向量中的单词的频率。我已经谷歌了我的问题无数次，但没有去一些对我有用的东西。我找到了一个站点，有人说要使用unique命令来统计单词的频率，但我找不到任何示例来说明如何做到这一点。

浏览 3提问于2012-03-08得票数 1

回答已采纳

4回答

词性标注-从哪里开始？

、、、

我想收集有关单词频率的统计数据，但另外要确保每个单词都被正确识别(或大多数单词)。让我们说，“绿草”，“漂亮女孩”，“小心处理”，“你是对的”。这样我们就可以准确地说出，在语言中经常一起使用的单词序列是什么。有没有开放的Java工具&关于这个主题的好书？

浏览 3提问于2010-02-05得票数 0

2回答

如何使用python查找文本文件中单词的出现频率？但是用户应该给出输入词

、

我的目标是:统计用户在文本文件中输入单词的频率。(在python中)我尝试了this.But，它给出了file.How中所有单词的频率。我可以修改它来给出用户输入单词的频率吗？

浏览 28提问于2020-03-30得票数 0

回答已采纳

5回答

统计每个单词的出现频率

、、、、

如何统计每个文件中每个单词的出现频率？单词是指一组字符，可以包含字母、数字和下划线字符。

浏览 1提问于2012-03-30得票数 3

回答已采纳

1回答

为什么不是所有的二元语法都在gensim的‘`Phrases`’工具中创建？

、、、、

我使用gensim创建了一个二元模型，并尝试获取二元句子，但它没有选择所有的二元句子，为什么？phrases = Phrases(sentences, min_count=1, threshold=1)sent = [u'the', u'mayor', u'of', u'new', u'york', u'was', u'th

浏览 10提问于2020-02-07得票数 1

回答已采纳

1回答

Python -找出文本文件中每对可能的单词在同一行中出现的频率的最有效方法？

、、、、

要浏览一个大文件，收集(整个文件)两个单词在同一行中出现的频率的统计数据，最好的方法是什么？“这是白色棒球。”“这些家伙有白色的棒球棒。”您将最终收集以下统计信息：(this，is: 1)，(this，the: 1)，(this，白色: 1)，(this，棒球: 1)，(is，the: 1)，(is，白色: 1)，(is，棒球: 1)……对于条目(棒球，白色: 2)，该值将为2，因为这对单词在同一行中总共出现了2次。理想情况下，统计信息应该放在字典中，其

浏览 0提问于2010-10-02得票数 2

回答已采纳

1回答

列出标题的最简单的方法？

我在这里的深度太大了--希望这篇文章没问题。我有1000条左右的标题。我试图找出标题是关于同一件事，但措辞不同。

浏览 7提问于2022-05-23得票数 2

1回答

如何统计java文档中单词的出现频率？

、

我是Java的初学者，我有一个程序可以计算多个文档中的字数作为数组，然后给出输出，在一个新文件中以某个帐户的名称创建。我已经使用了下面的函数，我可以用其他更简单的函数来替换它吗？

浏览 1提问于2017-01-25得票数 1

1回答

概率与大小成比例的随机样本

、

我在一个统计项目中，我有一个表，其中包含单词和每个单词在文本中的频率，我想要的是一个样本，其中包含频率最高的单词你好，下午好，我希望有人能帮助我。我有一个表，里面有单词，以及每个单词在文本中出现的频率。

浏览 0提问于2019-07-11得票数 0

1回答

按值对字典进行排序

我从一堆或电子邮件中读取数据，并计算每个单词的频率。首先构造两个计数器：counters.chi = collections.counter()气的关键是与统计中的词相同的词。我想按“chi.‘”中的键对“stats”中的键进行排序。

浏览 0提问于2012-05-05得票数 1

回答已采纳

1回答

如何从包含2个元组的列表中的最后一个条目中检索第二个值？

、、

我使用map扫描输入文件并生成字数统计。映射键是单词，值是单词的出现次数。我将映射转换为列表，并按值升序排序。因此，我有一个包含2个元组的列表，出现频率最低的单词在列表的第一个位置，出现频率最高的单词在列表的最后一个位置。

浏览 2提问于2012-09-27得票数 0

回答已采纳

2回答

使用前十名从collections.counter中排除单词

、、

我想通过使用以下命令来统计某些文档中使用的单词的频率：我无法简单地将.subtract( exclusion_list )添加到此命令中，其中exclusion_list是我不想要的单词列表。如何才能在不包含排除列表的情况下获得前十个单词？

浏览 3提问于2015-04-15得票数 2

1回答

检查开放式问题的n-单词频率

、、

首先是单词云，然后我遇到了一个问题，当我想统计2-3个单词短语的频率时。TermDocumentMatrix(corpus,control=list(tokenize=tokenize_ngrams))结果应该是2个单词的短语和频率

浏览 2提问于2017-07-18得票数 0

点击加载更多

Java Stanford NLP:查找词频？

Apache Pig字数统计程序

gensim:在doc2vec词汇表中检索词频

Mapreduce字数统计Hadoop最高频字

在apache-beam中写入多个Kafka主题？

如何用python对英语单词进行分类？

如何在R中统计我的csv文件中特定单词的出现频率？

是否可以使用c++中的unique命令来获取频率

词性标注-从哪里开始？

如何使用python查找文本文件中单词的出现频率？但是用户应该给出输入词

统计每个单词的出现频率

为什么不是所有的二元语法都在gensim的‘`Phrases`’工具中创建？

Python -找出文本文件中每对可能的单词在同一行中出现的频率的最有效方法？

列出标题的最简单的方法？

如何统计java文档中单词的出现频率？

概率与大小成比例的随机样本

按值对字典进行排序

如何从包含2个元组的列表中的最后一个条目中检索第二个值？

使用前十名从collections.counter中排除单词

检查开放式问题的n-单词频率

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐