Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >Python:创建一个计算文本文件中特定单词数量的函数

问Python:创建一个计算文本文件中特定单词数量的函数
EN

Stack Overflow用户

提问于 2019-10-21 09:38:53

回答 2查看 2K关注 0票数 0

我想创建一个函数来返回文本文件中特定单词的字数计数的值。

这是我目前所拥有的：

def Word_Counter(Text_File, Word):

    Data = open(Text_File, 'r').read().lower()

    count = Data.count(Word)


    print(Word, "; ", count)

Word_Counter('Example.txt', "the")

返回："the；35“

这就是我想让它做的事情。但是，如果我想测试文本中的一系列单词，该怎么办呢？我想要列表或字典中的单词(键)和值。在不使用模块的情况下，有什么方法可以做到这一点？

假设我用这个单词列表测试了这个函数: time，when，left，I，do，an，who，what，time。

我希望得到的结果如下：

Word Counts = {'time': 1, 'when': 4, 'left': 0, 'I': 5, 'do': 2, 'an': 0, 'who': 1, 'what': 3, 'sometimes': 1}

我已经能够创建一个字典，对每个单词进行单词计数，如下例所示。

wordfreq = {}
for word in words.replace(',', ' ').split():
   wordfreq[word] = wordfreq.setdefault(word, 0) + 1

我想做一个类似的风格，但只针对特定的单词，有什么建议吗？

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-10-21 09:47:22

从您给定的代码中，我没有对此进行测试。

def Word_Counter(Text_File, word_list):

        Data = open(Text_File, 'r').read().lower()
        output = {}
        for word in word_list:
           output[word] = Data.count(Word)

或者你可以这样做

text = open("sample.txt", "r") 

# Create an empty dictionary 
d = dict() 

# Loop through each line of the file 
for line in text: 
    # Remove the leading spaces and newline character 
    line = line.strip() 

    # Convert the characters in line to  
    # lowercase to avoid case mismatch 
    line = line.lower() 

    # Split the line into words 
    words = line.split(" ") 

    # Iterate over each word in line 
    for word in words: 
        # Check if the word is already in dictionary 
        if word in d: 
            # Increment count of word by 1 
            d[word] = d[word] + 1
        else: 
            # Add the word to dictionary with count 1 
            d[word] = 1

票数 0

EN

Stack Overflow用户

发布于 2019-10-21 09:53:11

更新

尝试以下操作：

keywords = ['the', 'that']
worddict = {}

with open('out.txt', 'r') as f:
    text = f.read().split(' ')  # or f.read().split(',')

for word in text:
    worddict[word] = worddict[word]+1 if word in worddict else 1

print([{x, worddict[x]} for x in keywords])

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58483592

复制

相关文章

python入门（八）单词堆中查找特定单词（正则表达式）

正则表达式

#用正则表达式找到文本中所有的s开头，e结尾的单词 import re text = "site sea sue sweet see case sse ssee loses" m = re.findall(r"\bs\S*e\b", text) if m: print(m) else: print('not match') 以上程序中所用到的知识点如下： re.findall(r"正则表达式", text) #re是python里的正则表达式模块 findall() #用来按照

星辉

2019/01/15

3.7K0

php案例计算字符串单词数量

作者：陈业贵华为云享专家 51cto(专家博主明日之星 TOP红人) 阿里云专家博主文章目录什么是单词？ cyg.php ---- 什么是单词？举个例子: aaa aaa aaa 这就是三个单词。 cyg.php <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title> 计算字符串单词数量 <

贵哥的编程之路

2022/09/23

3770

Git 如何从特定的提交中创建一个新的分支

通过在提交历史中单击右键，然后选择分支，你就可在当前指定的提交历史中来创建一个新的分支了。

HoneyMoose

2022/06/04

6.7K0

Git 如何从特定的提交中创建一个新的分支

MapReduce初体验——统计指定文本文件中每一个单词出现的总次数

ide 编程算法 mapreduce hadoop node.js

相信小伙伴们看了小菌上一篇博客《什么是MapReduce(入门篇)》后,对MapReduce的概念有了更深的认知!本篇博客,小菌为大家带来的则是MapReduce的实战——统计指定文本文件中每一个单词出现的总次数。

大数据梦想家

2021/01/22

1.4K0

MapReduce初体验——统计指定文本文件中每一个单词出现的总次数

GitHub 如何从特定的版本中创建分支

在 Git 的操作中，我们可能需要从特定的版本中创建分支。首先需要的第一步是活的当前项目的提交历史列表。然后在特定的版本后，选择 <> 标记，进入这个版本的提交历史。在左上角上，选择提交历史。在弹出的对话框中输入分支名称。在你输入名称后，将会提示你创建分支。这个的意思是从当前的提交版本中创建一个分支。然后可以从上面的提交中创建一个分支。在创建完成后，可以从分支列表中查看创建的分支列表。 https://www.ossez.com/t/github/13414

HoneyMoose

2021/04/02

6.8K0

GitHub 如何从特定的版本中创建分支

一个新的基于样本数量计算的的高斯 softmax 函数

softmax 函数在机器学习中无处不在：当远离分类边界时，它假设似然函数有一个修正的指数尾。

deephub

2022/06/04

6190

一个新的基于样本数量计算的的高斯 softmax 函数

【说站】python如何导入模块的特定函数

1、可以导入模块中的特定函数: from pygame import make_bullet。

很酷的站长

2022/11/24

1.9K0

【说站】python如何导入模块的特定函数

Python去除文本文件中的空行

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

村雨遥

2019/09/09

4.2K0

如何计算LSTM层中的参数数量

机器学习神经网络深度学习人工智能

长短期记忆网络（通常称为“ LSTM”）是一种特殊的RNN，经过精心设计LSTM能够学习长期的依赖。正如他的名字，它可以学习长期和短期的依赖。

deephub

2022/11/11

2.4K0

如何计算LSTM层中的参数数量

Python 去除文本文件中的空行

功能读取存在空行的文件，删除其中的空行，并将其保存到新的文件中；代码 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2019/3/18 21:41 # @Author : cunyu # @Site : cunyu1943.github.io # @File : deleteBlankLines.py # @Software: PyCharm """ 读取存在空行的文件，删除其中的空行，并将其保存到新的文件中 """

村雨遥

2022/06/15

1.6K0

数据算法之反转排序 | 寻找相邻单词的数量

spark scala sql mapreduce

想处理的问题是：统计一个单词相邻前后两位的数量，如有w1,w2,w3,w4,w5,w6,则：

王知无-import_bigdata

2020/02/10

4740

python中删除特定字符串

编程算法 https 网络安全网站

import re text = ‘wo,didi;wode,;wode’ text0 = text.replace(‘didi’, ”) print(re.sub(‘[,;]’, ‘ ‘, text0))

全栈程序员站长

2022/09/02

3.4K0

手动计算深度学习模型中的参数数量

编程算法机器学习神经网络人工智能

为什么我们需要再次计算一个深度学习模型中的参数数量？我们没有那样去做。然而，当我们需要减少一个模型中的文件大小甚至是减少模型推理的时间时，我们知道模型量化前后的参数数量是派得上用场的。（请点击原文查阅深度学习的高效的方法和硬件的视频。）

AI研习社

2019/05/08

3.7K0

手动计算深度学习模型中的参数数量

python 统计文件中单词出现的频率

index = {} with open(sys.argv[1], encoding='utf-8') as fp: for line_no, line in enumerate(fp, 1): for match in WORD_RE.finditer(line): word = match.group() column_no = match.start()+1 location = (line_no, column_no) # this is ugly; coded like this to make a point occurrences = index.get(word, []) # <1> occurrences.append(location) # <2> index[word] = occurrences # <3>

用户5760343

2019/07/31

1.9K0

用python统计日志中IP的数量

tcp/ip 正则表达式

日志文件，是我们记录用户行为的重要手段。而对于不同的用户，我们往往又会根据IP来区分，所以统计日志文件中的IP访问，对于数据分析人员和相关运营专员来说，是一件重要的事情，这里，采用python这门语言来完成这个小功能。

py3study

2020/01/07

1.5K0

MapReduce编程初体验（idea+VMware）:统计一个文档里的单词数量

jar java linux ide

将在idea里的java代码放在VMware里运行，具体操作步骤 java代码与在idea里的差不多，只有WordCountDriverLinux 做了一点改变其他的代码参考 MapReduce编程初体验（idea）：统计一个文档里的单词个数

用户4870038

2021/02/05

5490

MapReduce编程初体验（idea+VMware）:统计一个文档里的单词数量

MySQL创建计算字段及基本函数

编程算法云数据库 SQL Server r 语言数据库 sql

select concat(vend_name,'(',vend_country,')') from vendors order by vend_name;

小末快跑

2019/07/03

1.9K0

python读取特定的行

fr = open(filename) for line in fr.readlines(): if line.startswith("#"): continue else: ## do something with line ## could use fr.readlines()[1:] from second line import linecache content_list = linecache.getlines(filenam

py3study

2020/01/13

3.9K0

bash shell中创建函数

shell bash bash 指令

与R的定义方式相似，name是这个函数的名称。在调用函数时，bash shell会按命令在函数中出现的顺序依次执行。

生信编程日常

2020/07/14

8480

动态计算店铺数量

该报表显示了阿迪达斯每个季度的店铺数量，以及到2020年底的店铺数量（注意年底数量=Q4数量），另外，还显示了每个季度的开店数量，关店数量，净开/关店数量。

wujunmin

2021/09/07

1.5K0

相似问题

计算文本文件中单词的数量

12

PHP:我想计算文本文件中特定数量的单词数量。

22

如何计算一个单词中特定字母的数量？

22

计算列表中特定单词的数量。

35

如何计算文本文件中重复单词的数量？

11

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例