统计单词列表在多个文件中的出现次数_动态统计列表中多个单词的出现次数_统计单词在LISP列表中的出现次数 - 腾讯云开发者社区

java、multithreading

这是学校用的。我正在写一个java程序，它统计某个单词在文件中出现的次数，但它需要使用多线程来完成这项任务。但我不确定这意味着什么:并行是否意味着我获得文件的总字数，创建两个线程，然后给每个线程分配文件的不同部分进行处理？

浏览 0提问于2020-04-16得票数 0

5回答

统计每个单词的出现频率

c#、.net、c#-4.0、.net-4.0、word-frequency

有一个目录，里面有几个文本文件。如何统计每个文件中每个单词的出现频率？单词是指一组字符，可以包含字母、数字和下划线字符。

浏览 1提问于2012-03-30得票数 3

回答已采纳

3回答

我有两份名单。我需要确定第一个列表中哪个单词在第二个列表中出现得最频繁。首先，list1.txt包含一个单词列表，按字母顺序排列，没有重复。我使用了一些脚本，以确保每个单词都出现在一个独特的行上，例如： canyon fish forest mountain river 第二个文件，list2.txt在UTF-8中，还包含许多项。我还使用了一些脚本来确保每个单词都出现在一个独特的行上，但有些项目不是单词，有些项目可能会多次出现，例如： fish canyon ocean ocean ocean ocean 1423 fish 109 fish 109 109 ocean 脚本应该输出最频繁

浏览 5提问于2012-09-12得票数 4

回答已采纳

1回答

Cmake统计文件中单词的出现次数

cmake

我知道这听起来很奇怪。但是出现了一个新的要求，我们需要使用CMake (特别是以独立于平台的方式，不假设我们有任何其他工具，如python、perl等)来统计特定单词在所有C++文件中的出现次数。这有可能吗？如果是，是如何实现的？

浏览 0提问于2014-10-22得票数 0

1回答

在文本文件中搜索并统计包含特殊字符的特定短语

python、string、findall

我有一个搜索短语列表，其中一些是单个单词，一些是多个单词，一些在它们之间有一个连字符，而其他可能有括号和连字符。我正在尝试处理一个文本文件目录，搜索这些短语的100+，然后统计出现的次数。看起来下面的代码在2.7x的python中工作，直到它命中带连字符的搜索短语。我观察到一些文本文件中至少有一个连字符的搜索短语出现了一些意想不到的计数。 kwlist = ['phraseone', 'phrase two', 'phrase-three', 'phrase four (a-b-c) abc', 'phrase five

浏览 0提问于2017-10-25得票数 2

1回答

Python在短语列表中查找单词匹配项并将单词链接到短语

python、django、python-3.x

假设我有一个用换行符(\n)分隔短语的.txt文件我把它们分成词组列表 ["Rabbit eats banana", "Fox eats apple", "bear eats sanwich", "Tiger sleeps"] 我需要做的事情：我需要做list of word objects，每个单词都应该有：词组名称和频率(在phrases)list of it 中出现的次数对于word eats，结果将为： {'name':'eats', 'frequency': &

浏览 36提问于2018-07-28得票数 1

回答已采纳

1回答

如何使用Python语言中的MapReduce来计算一个单词序列在文件中出现的次数？

python、oop、hadoop、mapreduce、mrjob

考虑一个包含由空格分隔的单词的文件；用Python语言编写一个MapReduce程序，该程序统计每个3个单词的序列在文件中出现的次数。例如，考虑以下文件： one two three seven one two three three seven one seven one two 每个3个单词序列在此文件中出现的次数为： "three seven one" 2 "four seven one two" 1 "one two three" 2 "seven one two" 2 "two three seven"

浏览 43提问于2021-04-11得票数 0

回答已采纳

1回答

如何从包含2个元组的列表中的最后一个条目中检索第二个值？

scala、map、tuples

我使用map扫描输入文件并生成字数统计。映射键是单词，值是单词的出现次数。我将映射转换为列表，并按值升序排序。因此，我有一个包含2个元组的列表，出现频率最低的单词在列表的第一个位置，出现频率最高的单词在列表的最后一个位置。我知道使用myList.last可以很容易地将2tuple放在列表的最后位置，然后使用myTuple._2访问结果的第二个元素可以在一行代码中完成吗？我想让它尽可能简明扼要。

浏览 2提问于2012-09-27得票数 0

回答已采纳

3回答

使用Hadoop MapReduce进行排序字数统计

hadoop、mapreduce、word-count、parallel-processing

我对MapReduce非常陌生，我完成了一个Hadoop字数统计示例。在该示例中，它生成单词计数未排序文件(带有键-值对)。那么，是否可以通过将另一个MapReduce任务与前一个任务相结合来按单词出现的次数对其进行排序呢？

浏览 1提问于2010-03-31得票数 10

5回答

在python列表中操作字符串

python

我有一个tweet列表，它被分组为列表中的tweet块，如下所示： [[tweet1, tweet2, tweet3],[tweet4,tweet5,tweet6],[tweet7, tweet8, tweet9]] 我想统计每个单词在每个子组中出现的次数。要做到这一点，我需要将每个tweet分成单独的单词。我想使用类似于str.split(‘')的东西，但收到一个错误： AttributeError: 'list' object has no attribute 'split' 有没有办法把每条推文分成各自的单词？结果应该类似于： [['wo

浏览 0提问于2015-04-22得票数 3

5回答

Python:另一个列表中字典的出现次数

python、word-count、graphlab、sframe

我正在尝试根据感兴趣的单词的子集来计算单词在字典列中存在的次数。首先我导入我的数据 products = graphlab.SFrame('amazon_baby.gl/') products['word_count'] = graphlab.text_analytics.count_words(products['review']) products.head(5) 数据可以在这里找到：然后创建我感兴趣的单词列表： words = ['awesome', 'great', 'fantastic'

浏览 1提问于2016-06-04得票数 0

5回答

计算文件字数的最简单方法

scala

我正在尝试以最简单的方式编写一个程序，用Scala语言统计文件中单词的出现次数。到目前为止，我有以下几段代码： import scala.io.Codec.string2codec import scala.io.Source import scala.reflect.io.File object WordCounter { val SrcDestination: String = ".." + File.separator + "file.txt" val Word = "\\b([A-Za-z\\-])+\\b".r

浏览 1提问于2013-03-19得票数 12

回答已采纳

1回答

按事件和字母顺序对列表进行排序

python、sorting

我试着把一个句子放在列表中，然后根据单词在列表中的出现情况对列表进行排序，如果有必要，当两个单词出现相同的次数时，按字母顺序排序。我写了这段代码： def frequencia(texto): pals = texto.split() m = sorted(pals,key=pals.count,reverse=True) return m 问题是它重复了单词，并且没有按字母顺序排列。在“我是一个家伙，我很饿”这句话中，输出应该是' am '，'I'，'a'，' guy '，'hungry‘。

浏览 14提问于2021-02-22得票数 2

回答已采纳

6回答

在Python中获取唯一单词(即不重复的单词)列表

python

我有一个包含几个单词的列表，我想打印该列表中唯一的单词。说到“独特”，我指的是在我的原始列表中只出现一次的单词。也就是说，如果一个单词出现两次(或两次以上)，则不应打印该单词。下面是我的单词列表： my_list = ["door", "table", "door", "chair", "couch", "door", "table", "closet"] 下面是我到目前为止尝试过的代码： print(set(my_list)) 但是，set会打印一个包含所有单词的

浏览 5提问于2018-10-31得票数 2

2回答

JTextArea中的特定字数

java、swing

我手头的任务是向Jbutton添加一个事件，该事件将统计在JTextArea中显示的单词的出现次数。代码如下所示，但这会计算每一个单词； private void btnCountActionPerformed(java.awt.event.ActionEvent evt) { if(!(txtaInput.getText().trim().length()==0)){ String a = String.valueOf(txtaInput.getText().split("\\s

浏览 0提问于2014-05-20得票数 0

3回答

比较相似单词的两个字符串列表并测量单词出现的频率- JAVA

java、arraylist、hashset

我意识到我在这里同时问了两个独立的问题，但我认为它们是相关的(即使只是轻微的)。无论如何，我想要做的是比较两个String列表(不一定是Java列表)，并删除两个列表中出现的单词。我在考虑使用ArrayList或HashSet与HashSet一起使用，因为列表没有排序，但我对HashSet的问题是，我读到它们不允许重复。这与我的其他需求略有冲突，因为我希望能够计算每个单词出现的次数，但只显示有意义的once...if。想一想WordCloud的例子。这是我目前所做的，将两个文本文件的内容保存到两个ArrayList中： ArrayList<String> words = new

浏览 0提问于2013-01-09得票数 1

回答已采纳

4回答

python regex，用于计算只有一个特定单词的字符串中的行数

python、regex

我想要找出一个给定的字符串是我的字符串中一行上的唯一单词的次数。例如，如果单词为"max"，字符串为： str = """max hello max max hi max""" 正确的输出应该是2。我尝试使用re.findall函数： from re import findall findall(r'^\max\n', str) 但它只统计了一次"max"的出现 ['max\n']

浏览 0提问于2017-08-19得票数 0

1回答

bash脚本:网站中出现的单词

linux、bash、shell、dns

我需要一个脚本来统计网页上出现的单词。我正在做的是计算随机it(避免多次检查相同的IPs )，使用nmap查看端口80是否打开，以了解它是否是web服务器，然后使用w3m将http页面作为文件。在容易数数单词发生之后我有几个问题这个过程需要很多时间，但我想不出有什么方法能使它更快许多打开端口80的ips不是网站，它们没有运行，它们可能有一些问题，有什么方法只检查那些正在运行的站点吗？此方法只检查网站索引页中出现的单词，是否也有检查其他公共页面的方法？非常感谢

浏览 0提问于2012-08-03得票数 0

4回答

词性标注-从哪里开始？

java、parsing、nlp、linguistics

您好，我想知道如何实现这样一个任务的解决方案：有一个500Mb的纯英文文件。我想收集有关单词频率的统计数据，但另外要确保每个单词都被正确识别(或大多数单词)。在句子“她大声哭了”中的“哭”将被归类为名词，而“不要哭”将为统计数据提供动词。此外，过滤专有名称也很好，这样它们就可以形成另一个字典。另一项任务将更加困难。我想找出经常出现在一起的单词的出现情况，并建立这样的出现情况的列表。让我们说，“绿草”，“漂亮女孩”，“小心处理”，“你是对的”。这样我们就可以准确地说出，在语言中经常一起使用的单词序列是什么。我该如何开始呢？有没有开放的Java工具&关于这个主题的好书？

浏览 3提问于2010-02-05得票数 0

1回答

识别并计算R中匹配的数据帧？

假设我有一个数据帧列表，例如 list.df <- replicate(1000, data.frame(l = sample(letters[1:5], 4), n = sample(c(1:4), 4)), simplify = F) 如何统计列表中相同的数据帧出现的次数？

浏览 0提问于2017-11-21得票数 2

2回答

是否有可能标记n在vim中的模式的第n次出现？

regex、vim、substitution

假设我有一条如下所示的短信。那个人在走路，那个人在吃东西。如何使用替换将其转换为以下内容？男人1在走路，2人在吃饭。我知道我可以使用:%s/\<man\>//gn来统计单词man的出现次数，并且知道/\%($pattern$.\{-}\)\{n - 1}\zs\1可以找到第n次出现的模式。但我该怎么标记第n次呢？任何帮助都是真诚的感谢，谢谢。

浏览 3提问于2016-08-29得票数 5

回答已采纳

2回答

如何检查字符串中要查找的单词的前一个字母是否存在？递归

java、recursion

我目前正在创建一个java程序，它使用递归来统计字符串中特定单词的出现次数，但是，如果前面的字母是'a'，则该计数不会递增。我找不到一种方法来检查我要查找的单词的第一个字母之前的前一个字母。我尝试使用indexOf，然后减去1来检查前面的字母，但不起作用。下面是我目前的工作函数： //The value of text is abrichbbarichacrich //While the value of find is rich //Expected output should be 2 static int Count(String text, String find)

浏览 22提问于2021-05-23得票数 1

2回答

如何计算单词在一列中出现的次数，python

python、string、count

如何在Python中统计一个单词在一个字符串中出现了多少次？例如： file|context ----|------- 1 | Hello world 2 | Round and round 我想计算单词的出现次数： file| context | word_count ----|-----------------|--------------------- 1 | Hello world | {'hello':1,'world':1} 2 | Round and round | {'round':2,&#

浏览 2提问于2017-09-15得票数 0

2回答

使用python & xlrd统计Excel表中特定单词的出现数

python、xlrd

我正在编写一个python脚本，它查找与脚本位于同一个目录中的excel工作表(我大约有10个)，并计算这些文件(如云、vmware、python等)中出现的特定单词的数量。然后将每个单词的总数写入文本文件。我使用python和xlrd来完成这个任务。每个excel文件都有一个名为details的工作表，这就是信息所在的位置。每个文件有2列和大约26行。 for filename in os.listdir(path): if filename.find('xls') != -1: print filename workbook=xlrd.o

浏览 1提问于2015-04-20得票数 1

回答已采纳

2回答

如何使用本站学习CountVectorizer？

python-3.x、scikit-learn、countvectorizer

我有一组单词，我必须检查它们是否出现在文档中。 WordList = [w1, w2, ..., wn] 另一组有文档列表，我必须检查这些单词是否存在。如何使用scikit learn CountVectorizer，使得术语文档矩阵的特征只是来自WordList的单词，并且每一行代表每个特定的文档，而不是给定列表中的单词在各自的列中出现的次数？

浏览 1提问于2016-12-12得票数 2

回答已采纳

4回答

我可以使用数组的内容作为散列的键吗？

arrays、perl

我希望我的数组成为我的新散列的键。我正在写一个统计文档中单词出现次数的程序。 my @array = split(" ", $line); keys my %word_count = @array; #This does nothing 这段代码是在我逐行阅读infile时发生的。我正在尝试找到一种方法来完成这个项目使用散列。单词是关键字，它们出现的次数是值。但是，这一步尤其让我感到困惑。

浏览 0提问于2012-04-11得票数 2

2回答

Java排序集合/api

java、api、list、sorting、package

我想知道使用scanner搜索文档，计算一个单词出现的次数，并为每个单词创建一个按字母顺序排列的列表，以及每个单词后面跟着另一个单词的次数的子列表，使用哪种API或集合是最好的。这是一个类，所以请给我指出正确的方向，因为我对Java和包完全陌生，但我不想要任何实际的编码技巧，谢谢。

浏览 2提问于2012-07-07得票数 1

回答已采纳

1回答

我将如何排序一个字符串降序列表，然后升序(如果绑定的话)？

java、sorting

好吧，这个问题会让你说“什么？”但我试着给出一些背景。我正在编写一个程序，读取一个纯文本文件，按单词发生的次数降序排序文件中的字符串，然后对于发生次数相同的单词，我必须按字母顺序对这些单词进行排序…… 现在，我有一个名为“word”的数组列表，其中包含了我打开的文本文件中的每个单词。那么，如果出现了平数，我如何按降序按已发生的单词数排序，然后按字母顺序进行升序呢？所以如果我有一份清单是： [a, a, a, a, b, c, c, c, c, d, d, e, e, e, e, e] 排序后的输出列表如下： e : 5 a : 4 // notice the words that occu

浏览 0提问于2018-09-13得票数 1

2回答

Python:计算HTML中的特定单词数

python、beautifulsoup、python-requests

所以，我是一名Python新手，在学习网络抓取方面有相当的困难。我打算计算这个HTML页面中的单词数量，并显示哪些单词只出现一次，以及“女士”一词显示了多少次。到目前为止，我已经想出了这个： import requests from bs4 import BeautifulSoup import operator from collections import Counter def my_start(url): my_wordlist = [] my_source_code = requests.get(url).text my_soup = BeautifulSoup

浏览 23提问于2020-06-15得票数 2

回答已采纳

4回答

统计每个单词在文件中出现的次数

c++

嗨，我正在写一个程序，统计每个单词在文件中出现的次数。然后，它打印计数在800到1000之间的单词列表，按计数顺序排序。我坚持保持一个计数器，看看第一个单词是否与下一个单词匹配，直到出现一个新词。在主要部分中，我尝试打开文件，逐个单词地读取每个单词，并在while循环中调用sort来对向量进行排序。然后，在for循环中遍历所有单词，如果第一个单词等于第二个count++。我不认为这是你保持计数器的方式。代码如下： #include <string> #include <iostream> #include <fstream> #include <ve

浏览 1提问于2011-05-24得票数 2

回答已采纳

2回答

在python中比较两个列表中的单词

python、list、compare、words

在这件可能很简单的事情上，我会很感激有人的帮助:我有一个长长的['word', 'another', 'word', 'and', 'yet', 'another']形式的单词列表。我想将这些单词与我指定的列表进行比较，从而查找目标单词，无论它们是否包含在第一个列表中。我想要输出我的“搜索”单词中包含在第一个列表中，以及它们出现的次数。我尝试过像list(set(a).intersection(set(b)))这样的工具--但它将单词拆分，然后比较字母。我如何写一个单词列表，以便与现有的长列表进

浏览 1提问于2013-03-14得票数 2

4回答

有没有办法从Marklogic通用索引中获得索引词的列表？

xquery、marklogic

我在Marklogic工具上工作，我有一个大约27000个文档的数据库。我想要做的是检索任何搜索查询结果所给出的文档中出现频率最高的关键字。我目前正在使用xquery函数来统计作为查询结果检索到的所有文档中每个单词的出现频率。然而，这是相当低效的。我在想，如果我能得到marklogic已对其执行索引的单词列表，这将对我有所帮助。那么有没有办法从marklogic的通用索引中检索索引词的列表呢？

浏览 1提问于2012-05-25得票数 1

回答已采纳

2回答

从Python中的列表中删除句号、逗号、引号

python-2.7、word-frequency

我有一个文本文件中的单词频率统计的python代码。程序的问题是它考虑了fullstop，因此改变了计数。为了计算单词，我使用了一个排序的单词列表。我尝试使用以下命令删除句号 words = open(f, 'r').read().lower().split() uniqueword = sorted(set(words)) uniqueword = uniqueword.replace(".","") 但是我得到了错误，因为 AttributeError: 'list' object has no attribute

浏览 0提问于2014-02-19得票数 2

2回答

预测自动补全背后的算法/理论？

algorithm、text、autocomplete、nlp、probability

简单单词自动完成功能仅显示与已经键入的字符匹配的单词列表。但我想根据单词出现的概率对自动完成列表中的单词进行排序，这取决于之前键入的单词，依赖于文本语料库的统计模型。为此，我需要哪些算法和数据结构？你能给我一些好的教程的链接吗？

浏览 0提问于2012-07-12得票数 13

回答已采纳

2回答

基于R中的第二个列表的一个列表中的和词频率

r、regex、list

我需要根据一个单独的源列表来统计列表中单词或词组出现的频率。我有一个作者和研究领域的数据框架。每个作者都有一个或更多的研究领域(单词/单词短语)与他们的名字相关联的列表。有时，同一个研究领域不止一次出现，我希望每次都对它们进行统计(也就是说，不是一个独特的列表)。我需要统计一位作者的研究领域与一组研究领域中的研究区域相匹配的次数。我可以在每个作者的基础上做这件事，但不能为所有的作者名单。 (实际上，有4个研究范畴:生命科学、社会科学等)，我需要统计每个作者在每个研究类别中的研究领域的发生情况，即它们的列表中有多少生命科学领域，有多少社会科学领域在它们的列表中等等。一个简单的例子在一个研

浏览 3提问于2017-07-14得票数 0

回答已采纳

1回答

如何检查嵌套列表中的列表项是否存在于集合中？

python、set、nested-lists

我有一个嵌套的清单，每个句子从一个语料库。集合是不止一次发生的所有单词。如何检查列表中的每个单词是否在一组中，其中只包含一次出现的单词？然后，我需要用str替换不止一次出现的所有单词。我试过： for sent in tokenized_sents: for word in sent: if word in set: word = '<UNK>'

浏览 5提问于2022-02-22得票数 -1

回答已采纳

1回答

Python -找出文本文件中每对可能的单词在同一行中出现的频率的最有效方法？

python、dictionary、compare、line、statistics

这个问题很容易解决，但我不确定我得到的解决方案在计算上是否有效。所以我在请教专家！要浏览一个大文件，收集(整个文件)两个单词在同一行中出现的频率的统计数据，最好的方法是什么？例如，如果文本只包含以下两行： “这是白色棒球。”“这些家伙有白色的棒球棒。” 您将最终收集以下统计信息：(this，is: 1)，(this，the: 1)，(this，白色: 1)，(this，棒球: 1)，(is，the: 1)，(is，白色: 1)，(is，棒球: 1)……以此类推。对于条目(棒球，白色: 2)，该值将为2，因为这对单词在同一行中总共出现了2次。理想情况下，统计信息应该放在字典中，其中键在元

浏览 0提问于2010-10-02得票数 2

回答已采纳

4回答

使用java计算文本文件中重复单词的数量

java

如何在java中从路径打开文本文件，并使用标记器计算文件中重复的单词数。例如:我想使用路径名打开一个文件，并准备读取和统计文件中重复的单词

浏览 0提问于2010-12-31得票数 0

3回答

大规模文档共现分析

java、multithreading、performance、processing-efficiency

我有大约1000个文件。每个文档包含大约20,000个文档。我还有一个大约1,000,000个单词的列表。我想计算每个单词与任何其他单词出现的次数。因此，有一个大小为1mX1m的稀疏矩阵。为了加快计算速度，我通过执行以下操作分别处理每个文件： 1-我的机器中的每个内核都在处理单个文件，并输出以下格式的文件 WordId1 WordId2 Frequency 2-在完成每个文件后，我将1000个文件合并为一个文件。这是我目前的方法，但它需要很长时间才能做到，我认为应该有更有效的方法来做到这一点，所以欢迎您的意见。

浏览 1提问于2014-01-13得票数 7

1回答

把一个单词列表变成字典

javascript、ecmascript-6、hash-map

我正在寻找一种方法来将可能有重复的单词列表转换成一个字典/地图来统计单词出现的次数。花了一些时间在这个问题上，这似乎是更好的方法之一，但也许有一些不好的地方，我没有看到这一点。 const magazine = "asdf ASDF wer wer"; 这应该会产生一个magazineMap const magazineMap = { asdf: 1, ASDF: 1, wer: 2 } 我的解决办法是 function mapMagazine (magazine) { return magazine .split(' ')

浏览 0提问于2018-11-14得票数 1

回答已采纳

1回答

计算Python列表中的NaN

python

如何统计我的列表中出现NaN的次数？我的数据如下所示： [365788, 267102, 170941, 'NaN', 243293, 267093, 'NaN', 370448, 'NaN', 197091]

浏览 2提问于2017-03-25得票数 2

回答已采纳

1回答

如何在R中统计我的csv文件中特定单词的出现频率？

r、tm

在我的csv文档中只有评论(只有行，没有列).I想要统计单词的出现频率，例如，like，从我的csv文件中最好。我不想要每个单词的频率。我只想知道这三个单词在我的csv文档中出现的次数。我尝试了这些代码，但它给了我每个我不想要的单词的频率。有没有人能帮我解决如何统计特定单词或特定单词列表的频率？ texts <- read.csv("./Data/fast food/Domino's/Domino's veg pizza.csv",stringsAsFactors = FALSE) docs <- Corpus(VectorSource(te

浏览 2提问于2018-06-28得票数 0

3回答

用字典直接在单词列表中计算字母的出现情况

performance

我在用字典计数字母时遇到了问题，因为每个字母索引都有不同长度的单词列表中出现的字母。该列表从最长到最短的单词排序。就像这样： main_list = ['elephant','mouse','tiger','dog'] 对于索引0，字典应该是： {'e':1,'m':,'t':1,'d':1} 用于索引1 {'l':1,'o':2,'i':1} 用于索引2 {'e':1,'u':1,

浏览 7提问于2022-11-22得票数 0

1回答

使用python psychopg2获取数据库中包含特定字符串的所有变量的计数

python、sql、postgresql、python-3.x、postgresql-9.4

我有一个列表，words = word1，word2，word3，...我想使用sql返回每个单词在sql文件的A列中出现的次数。我不知道如何将变量传递给我的sql查询。任何帮助都将不胜感激！到目前为止，我的代码如下所示： import psycopg2 as sql for word in words conn = sql.connect(**params) c = conn.cursor() #Create query and parameters to get usernames and ids Query = """ SE

浏览 4提问于2017-08-15得票数 0

回答已采纳

2回答

从字典创建对象列表

python-3.x、class、object

首先，我有一个计算文本文件中单词的函数，以及一个根据单词在文本文件中出现的次数创建字典的程序。该程序是 def counter (AllWords): d = {} for word in AllWords: if word in d.keys(): d[word] = d[word] + 1 else: d[word] = 1 return d; f = open("test.txt", "r") AllWords = [] for word in f.

浏览 3提问于2017-02-07得票数 1

回答已采纳

1回答

CouchDB中的map-reduce函数

mapreduce、couchdb

我有一个java程序，可以读取PDF文件中的所有单词。我将单词和页面枚举器一起保存在数据库(couchDB)中。现在我想写一个map和一个reduce函数，它列出每个单词以及单词出现的页面枚举数，但是如果单词在一个页面上出现多次，我只想要一个条目。结果应该是一行包含word，第二行包含一个页面枚举列表(字符串，用逗号分隔)。在couchDB中，每个带有页码的单词都是一个单独的文档。如何使用map-reduce函数(过滤页面枚举数的相同条目)来完成此操作？谢谢你的帮助。

浏览 2提问于2013-06-03得票数 2

4回答

字符串中的单词出现次数(单词计数)

java、string、word-count

我一直在写字符串中出现的单词。我得到了一些使用compareToIgnoreCase的提示(在任务笔记中)。所以我尝试了这样的方法： splitwords = StringCont.split("\\s"); for(int i=0; i<splitwords.length; i++) { if(splitwords[1].compareToIgnoreCase(splitwords[i]) == 0) splitcount++; } 当然，这正是我所能做的，而且可能是不好的方法。当我运行代码时，我有时会遇到数组异常，有时它会运行。缺少的是:检查所

浏览 0提问于2009-12-21得票数 0

回答已采纳

1回答

将出现的次数写入文件

python

我正在统计列表中出现的单词数(称为a_master)。搜索和计数的单词在dictionary.txt中。问题是，当我将计数写到文件中时，结果如下： 1Count cloud 19Count openstack 3 这是密码： with open("dictionary.txt","r") as f: for line in f: if a_master.count(line.strip()) !=0: file.write( "Count " + line + str((a_master).count(line.stri

浏览 1提问于2015-04-23得票数 1

回答已采纳

2回答

文件读取IO

java、sorting、search、file-io

我最近一直在努力争取在这项任务中取得实质性进展。我需要创建一个接收文本文件的程序，并创建生成文本文件中每个单词的输出、该单词出现的次数以及整个文件中出现的百分比。现在，我的主要问题是读取文本文件的所有值。我试图使用数组列表来存储我所读到的内容。部分细节包括应该忽略逗号、句号、分号、冒号和感叹号等字符。这是全部任务：编写一个读取普通文本文件的程序，以构造一个单词列表和每个单词发生的次数。完成后，程序到控制台的输出应该是一个有三列的表:单词found。单词在文件中出现的次数。发现的事件的比例(例如2.17%)。这张表是按词典顺序排列的。标点符号(,.;:!)出现在单词的末尾，应该删除。大写和

浏览 0提问于2015-12-20得票数 0

回答已采纳

2回答

Mathematica -从字符串搜索中排除字符串

pattern-matching、wolfram-mathematica、string-matching

我正在尝试选择表格中出现频率最高的关键字。我需要搜索列表中不包括给定的第二个、第三个、第四个等单词的单词的出现次数。例如，我需要搜索单词"lollypop“在不包括单词"candy”的列表中出现的次数。这段代码将返回单词"lollypop“出现的次数： rt = Parallelize@ Cases[MemoizeTable["Candy_table.txt"], x_List /; MemberQ[x, s_String /; StringMatchQ[s, ("*lollypop*"), Ig

浏览 1提问于2011-07-07得票数 0

回答已采纳