查找单词频率和绘图结果

、、、、

我目前在一个文本文件中有一个单词列表，文档中的所有单词都在单独的一行上。我还将嵌套的json数据导入到pandas数据框中。experimental approach to alleviating global poverty\"", }, 我需要使用文本文件中的单词来找出json文件中每个类别的各种频率(例如:化学)。然后，我被要求使用Matplotlib为每个主题绘制多个频率(

浏览 15提问于2019-12-03得票数 1

1回答

在另一个数组js中找到值的数组？

、、

您好，我需要阅读文本与近30万个单词，并从输入字典中确定每个单词的全局频率，并制作一个数组。我有句子文件和字典文件与单词和它们的频率…这是我的代码： const sentenceFreq = []; for (const sentence of srcSentences因此，如果我的文本是“今天是美丽的一天”，代码应该搜索每个单词，在英语词典中找到它，并返回它的频率，所以结果应该是[{1334:&

浏览 30提问于2021-06-22得票数 0

回答已采纳

1回答

使用R中的文本挖掘在一组PDFS中找到一组特定的单词

、

我正在查看一组10个PDF，我想要编写的代码将告诉我在文档中我预先确定的几个单词出现的次数。到目前为止，我一直在使用pdftools函数和tm函数来查找文档中最常见单词的频率，但我不知道如何查找特定的单词。谢谢!

浏览 5提问于2022-02-16得票数 0

1回答

在多个文件中查找单词的交集/频率

、

>我该怎么做呢？我是否应该在countWords函数本身的for循环中检查它。

浏览 3提问于2012-08-16得票数 0

1回答

我应该在这里使用哪种数据结构？

目前，我的程序有一本字典，里面包含了所有年份，以及每年在文献中总共使用了多少单词。我是否需要制作另一本包含年份和该单词在该年份中使用次数的字典？或者是完全不同的数据结构？我还应该提到的是，用户提供了开始日期和结束日期。下面是我目前拥有的字典的函数。如果你有任何

浏览 0提问于2016-12-01得票数 5

1回答

java.io.NotSerializableException:当我使用带自定义项的条件创建新列时为org.apache.spark.sql.Column

、

我创建了一个基于文本摘要的数据框架来查找文档频率(DF)和反向文档频率(IDF)。但是，当我尝试使用用户定义的函数计算dataframe中每一行的IDF时，我得到了上面提到的错误。

浏览 16提问于2020-02-13得票数 0

2回答

查找单词的频率并输出每个单词组和频率。

、

我已经尝试了大约两个星期，但没有结果。我有字串，我想找出每个词组的频率，打印单词(不管单词是否多次出现)，以及每个单词组的总频率。

浏览 3提问于2022-09-24得票数 0

回答已采纳

1回答

Python字典和文本文件的交集

、、

我正在完成一个NLP练习，需要一些帮助来获得我的结果。我有两个文本文件，一个是单词列表，比如词汇表，另一个是文章。我需要计算输入文章中我的文本文件列表中每个单词的频率。我已经导入了文本，对两个文件中的单词进行了标记化/拆分，现在我将文章中的单词放入字典中。我的下一步是查找(我假设)字典和单词列表文本文件的交集，并返回我的文章中存在的单词条目的频率。我把我文章里所有的词都写在字典里了.现在

浏览 16提问于2021-02-11得票数 0

2回答

如何提取R中的一个词子集的词频？

、、、

我有一个数据数据，在一列中有大约10,000个单词，在另一列中有相应的频率。我也有一个大约600个单词的向量。600个单词中的每一个都是数据帧中的一个单词。如何从10,000字数据帧中查找600字矢量的频率？

浏览 5提问于2017-08-10得票数 0

回答已采纳

1回答

脚本在本机java中构建单词对及其频率。

这是我第一次编程，我们的任务是在文本文件中同时查找单词频率和词对频率。我在网上学习了几个教程，并实现了一个相当快的单词计数解决方案，但是我不知道如何在ho上实现一个方法来获取文本文件中的所有单词对，并总结重复单词对的频率，然后再添加到一个数组(hashmap)中。

浏览 3提问于2022-05-18得票数 -2

1回答

如何在Ruby中实现优先级队列或堆？

、

我有：k = 3 "i"和"love"出现了两次，而"leet"和"code"出现了一次。========================================================================== k表示频率<

浏览 0提问于2018-05-22得票数 0

回答已采纳

1回答

如何使用Python正则表达式查找所有出现两次字母的单词？

、、

我遇到了一个关于查找单词中包含特定频率的字母的单词的问题。给定一个单词列表，例如，['elle','household','lel','bye']，我想使用正则表达式查找恰好有2 'l's的单词，而不管字母的位置。

浏览 82提问于2019-04-01得票数 -1

2回答

MySQL，查找列中的每个字符串/单词频率。

、

我只想使用MySQL (如果可能的话)来查找列中的每个单词频率。结果：I 2 to 1pizza 1等等。有可能吗？如果是的话，请帮忙，谢谢

浏览 0提问于2018-06-26得票数 0

回答已采纳

2回答

快速计算差值字数数据帧

、

一段时间以来，我一直在为以下问题而挣扎：我想计算两个数据帧之间的字数差异(特征出现的频率)。数据帧包含两列:特征(单词)和频率。我想用df A en df B实现以下结果:来自df A的所有特征/单词和A的频率减去B的频率。但是，当A中的特征没有出现在B中时，我只想要回A的频率。我已经尝试了两个sapply函数:1获取名称向量A的名称:特征和频率，1获取B中相同特征的<

浏览 12提问于2018-09-05得票数 0

回答已采纳

12回答

如何在内存不足的环境中找到书中的高频词？

、

最近，在一次技术面试中，我被要求编写一个程序来查找教科书中出现频率最高的单词(出现次数最多的单词)。程序的设计方式应该是，以最小的内存处理整个课本。性能不是问题。我可以编程来找到单词的频率，但它消耗了大量的内存。-Snehal

浏览 13提问于2009-04-12得票数 5

回答已采纳

2回答

如何将word cloud用于twitter应用程序

、、、

我正在开发一个twitter应用程序，我想要在word cloud中显示所有趋势。但我不知道如何使用word cloud，也不知道我将使用twitter的哪个api来实现这一点。请帮帮我。

浏览 0提问于2009-11-13得票数 0

回答已采纳

4回答

如何根据字母在单词中的出现频率对字母进行排序？

、、

我想按字母在单词中出现的频率降序排序。但是，如果两个字母的频率相同，则应按字母顺序选择前面的字母。我使用计数器来查找所有字母的频率，它返回一个字典。如何按频率降序排序，然后按字母顺序选择n个频率最高的字母 string='ddddaacccbb'from collections import Counter counter=Counter(string) 假设单词是'ddddaacccbb‘，n是3，那么它应该

浏览 76提问于2019-06-02得票数 0

回答已采纳

1回答

从列表中查找单词列表中唯一的例句

、、、、

我有一个3000个单词的列表(大部分是唯一的)，按它们在英语中的频率排序。我还列出了3000句独特的句子。理想情况下，我希望使用Python为每个单词的使用生成一个示例语句的列表。但这是个陷阱，这是一个混乱的数据集，所以许多单词会出现在一个以上的句子中，一些单词只会出现在一个句子中，而许多单词不会出现在任何一个句子中。所以我不会得到我理想的结果。相反，我想要的是一个最理想的列表，列出与单词匹配的最多的句子。然后是被省略的句子列表。而且，理想情况下，排序

浏览 5提问于2020-09-24得票数 1

4回答

Lucene是如何工作的

我想知道lucene搜索是如何如此快速地工作的。我在网上找不到任何有用的文档。如果你有任何东西(除了lucene源代码)可读，请告诉我。

浏览 2提问于2010-04-25得票数 90

回答已采纳

1回答

使用可更新查询进行Cassandra排序

、、、、

我有一个包含属性、内容和年份的数据集。我想把它们放入CF‘word’和属性(‘内容’、‘年份’、‘频率’)。CF应支持以下操作。可以更新列的频率属性(即-：可以运行类似于“更新单词设置频率=2其中的内容=‘abc’和year=1990；]的查询，其中子句应该包含内容和年份。应该支持select查询，例如“从单词中选择内容，其中年份=2010年，按频率排序；”(其中子句只有年份)，其中的结果可以使用<

浏览 3提问于2014-11-12得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在另一个数组js中找到值的数组？

使用R中的文本挖掘在一组PDFS中找到一组特定的单词

在多个文件中查找单词的交集/频率

我应该在这里使用哪种数据结构？

java.io.NotSerializableException:当我使用带自定义项的条件创建新列时为org.apache.spark.sql.Column

查找单词的频率并输出每个单词组和频率。

Python字典和文本文件的交集

如何提取R中的一个词子集的词频？

脚本在本机java中构建单词对及其频率。

如何在Ruby中实现优先级队列或堆？

如何使用Python正则表达式查找所有出现两次字母的单词？

MySQL，查找列中的每个字符串/单词频率。

快速计算差值字数数据帧

如何在内存不足的环境中找到书中的高频词？

如何将word cloud用于twitter应用程序

如何根据字母在单词中的出现频率对字母进行排序？

从列表中查找单词列表中唯一的例句

Lucene是如何工作的

使用可更新查询进行Cassandra排序

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐