Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Python:创建一个计算文本文件中特定单词数量的函数

Python:创建一个计算文本文件中特定单词数量的函数
EN

Stack Overflow用户
提问于 2019-10-21 09:38:53
回答 2查看 2K关注 0票数 0

我想创建一个函数来返回文本文件中特定单词的字数计数的值。

这是我目前所拥有的:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def Word_Counter(Text_File, Word):

    Data = open(Text_File, 'r').read().lower()

    count = Data.count(Word)


    print(Word, "; ", count)

Word_Counter('Example.txt', "the")

返回:"the;35“

这就是我想让它做的事情。但是,如果我想测试文本中的一系列单词,该怎么办呢?我想要列表或字典中的单词(键)和值。在不使用模块的情况下,有什么方法可以做到这一点?

假设我用这个单词列表测试了这个函数: time,when,left,I,do,an,who,what,time。

我希望得到的结果如下:

Word Counts = {'time': 1, 'when': 4, 'left': 0, 'I': 5, 'do': 2, 'an': 0, 'who': 1, 'what': 3, 'sometimes': 1}

我已经能够创建一个字典,对每个单词进行单词计数,如下例所示。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wordfreq = {}
for word in words.replace(',', ' ').split():
   wordfreq[word] = wordfreq.setdefault(word, 0) + 1

我想做一个类似的风格,但只针对特定的单词,有什么建议吗?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-10-21 09:47:22

从您给定的代码中,我没有对此进行测试。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def Word_Counter(Text_File, word_list):

        Data = open(Text_File, 'r').read().lower()
        output = {}
        for word in word_list:
           output[word] = Data.count(Word)

或者你可以这样做

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
text = open("sample.txt", "r") 

# Create an empty dictionary 
d = dict() 

# Loop through each line of the file 
for line in text: 
    # Remove the leading spaces and newline character 
    line = line.strip() 

    # Convert the characters in line to  
    # lowercase to avoid case mismatch 
    line = line.lower() 

    # Split the line into words 
    words = line.split(" ") 

    # Iterate over each word in line 
    for word in words: 
        # Check if the word is already in dictionary 
        if word in d: 
            # Increment count of word by 1 
            d[word] = d[word] + 1
        else: 
            # Add the word to dictionary with count 1 
            d[word] = 1
票数 0
EN

Stack Overflow用户

发布于 2019-10-21 09:53:11

更新

尝试以下操作:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
keywords = ['the', 'that']
worddict = {}

with open('out.txt', 'r') as f:
    text = f.read().split(' ')  # or f.read().split(',')

for word in text:
    worddict[word] = worddict[word]+1 if word in worddict else 1

print([{x, worddict[x]} for x in keywords])
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58483592

复制
相关文章
python入门(八)单词堆中查找特定单词(正则表达式)
#用正则表达式找到文本中所有的s开头,e结尾的单词 import re text = "site sea sue sweet see case sse ssee loses" m = re.findall(r"\bs\S*e\b", text) if m: print(m) else: print('not match') 以上程序中所用到的知识点如下: re.findall(r"正则表达式", text) #re是python里的正则表达式模块 findall() #用来按照
星辉
2019/01/15
3.7K0
php案例 计算字符串单词数量
作者:陈业贵 华为云享专家 51cto(专家博主 明日之星 TOP红人) 阿里云专家博主 文章目录 什么是单词? cyg.php ---- 什么是单词? 举个例子: aaa aaa aaa 这就是三个单词。 cyg.php <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title> 计算字符串单词数量 <
贵哥的编程之路
2022/09/23
3770
php案例 计算字符串单词数量
Git 如何从特定的提交中创建一个新的分支
通过在提交历史中单击右键,然后选择分支,你就可在当前指定的提交历史中来创建一个新的分支了。
HoneyMoose
2022/06/04
6.7K0
Git 如何从特定的提交中创建一个新的分支
MapReduce初体验——统计指定文本文件中每一个单词出现的总次数
相信小伙伴们看了小菌上一篇博客《什么是MapReduce(入门篇)》后,对MapReduce的概念有了更深的认知!本篇博客,小菌为大家带来的则是MapReduce的实战——统计指定文本文件中每一个单词出现的总次数。
大数据梦想家
2021/01/22
1.4K0
MapReduce初体验——统计指定文本文件中每一个单词出现的总次数
GitHub 如何从特定的版本中创建分支
在 Git 的操作中,我们可能需要从特定的版本中创建分支。 首先需要的第一步是活的当前项目的提交历史列表。 然后在特定的版本后,选择 <> 标记,进入这个版本的提交历史。 在左上角上,选择提交历史。 在弹出的对话框中输入分支名称。 在你输入名称后,将会提示你创建分支。 这个的意思是从当前的提交版本中创建一个分支。 然后可以从上面的提交中创建一个分支。 在创建完成后,可以从分支列表中查看创建的分支列表。 https://www.ossez.com/t/github/13414
HoneyMoose
2021/04/02
6.8K0
GitHub 如何从特定的版本中创建分支
一个新的基于样本数量计算的的高斯 softmax 函数
softmax 函数在机器学习中无处不在:当远离分类边界时,它假设似然函数有一个修正的指数尾。
deephub
2022/06/04
6190
一个新的基于样本数量计算的的高斯 softmax 函数
【说站】python如何导入模块的特定函数
1、可以导入模块中的特定函数: from pygame import make_bullet。
很酷的站长
2022/11/24
1.9K0
【说站】python如何导入模块的特定函数
Python去除文本文件中的空行
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
村雨遥
2019/09/09
4.2K0
如何计算LSTM层中的参数数量
长短期记忆网络(通常称为“ LSTM”)是一种特殊的RNN,经过精心设计LSTM能够学习长期的依赖。正如他的名字,它可以学习长期和短期的依赖。
deephub
2022/11/11
2.4K0
如何计算LSTM层中的参数数量
Python 去除文本文件中的空行
功能 读取存在空行的文件,删除其中的空行,并将其保存到新的文件中; 代码 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2019/3/18 21:41 # @Author : cunyu # @Site : cunyu1943.github.io # @File : deleteBlankLines.py # @Software: PyCharm """ 读取存在空行的文件,删除其中的空行,并将其保存到新的文件中 """
村雨遥
2022/06/15
1.6K0
数据算法之反转排序 | 寻找相邻单词的数量
想处理的问题是:统计一个单词相邻前后两位的数量,如有w1,w2,w3,w4,w5,w6,则:
王知无-import_bigdata
2020/02/10
4740
python中删除特定字符串
import re text = ‘wo,didi;wode,;wode’ text0 = text.replace(‘didi’, ”) print(re.sub(‘[,;]’, ‘ ‘, text0))
全栈程序员站长
2022/09/02
3.4K0
手动计算深度学习模型中的参数数量
为什么我们需要再次计算一个深度学习模型中的参数数量?我们没有那样去做。然而,当我们需要减少一个模型中的文件大小甚至是减少模型推理的时间时,我们知道模型量化前后的参数数量是派得上用场的。(请点击原文查阅深度学习的高效的方法和硬件的视频。)
AI研习社
2019/05/08
3.7K0
手动计算深度学习模型中的参数数量
python 统计文件中单词出现的频率
index = {} with open(sys.argv[1], encoding='utf-8') as fp: for line_no, line in enumerate(fp, 1): for match in WORD_RE.finditer(line): word = match.group() column_no = match.start()+1 location = (line_no, column_no) # this is ugly; coded like this to make a point occurrences = index.get(word, []) # <1> occurrences.append(location) # <2> index[word] = occurrences # <3>
用户5760343
2019/07/31
1.9K0
用python统计日志中IP的数量
 日志文件,是我们记录用户行为的重要手段。而对于不同的用户,我们往往又会根据IP来区分,所以统计日志文件中的IP访问,对于数据分析人员和相关运营专员来说,是一件重要的事情,这里,采用python这门语言来完成这个小功能。
py3study
2020/01/07
1.5K0
MapReduce编程初体验(idea+VMware):统计一个文档里的单词数量
将在idea里的java代码放在VMware里运行,具体操作步骤 java代码与在idea里的差不多,只有WordCountDriverLinux 做了一点改变 其他的代码参考 MapReduce编程初体验(idea):统计一个文档里的单词个数
用户4870038
2021/02/05
5490
MapReduce编程初体验(idea+VMware):统计一个文档里的单词数量
MySQL创建计算字段及基本函数
select concat(vend_name,'(',vend_country,')') from vendors order by vend_name;
小末快跑
2019/07/03
1.9K0
python读取特定的行
fr = open(filename) for line in fr.readlines():     if line.startswith("#"):         continue     else:         ## do something with line          ## could use fr.readlines()[1:]  from second line import linecache content_list = linecache.getlines(filenam
py3study
2020/01/13
3.9K0
bash shell中创建函数
与R的定义方式相似,name是这个函数的名称。在调用函数时,bash shell会按命令在 函数中出现的顺序依次执行。
生信编程日常
2020/07/14
8480
动态计算店铺数量
该报表显示了阿迪达斯每个季度的店铺数量,以及到2020年底的店铺数量(注意年底数量=Q4数量),另外,还显示了每个季度的开店数量,关店数量,净开/关店数量。
wujunmin
2021/09/07
1.5K0
动态计算店铺数量

相似问题

计算文本文件中单词的数量

12

PHP:我想计算文本文件中特定数量的单词数量。

22

如何计算一个单词中特定字母的数量?

22

计算列表中特定单词的数量。

35

如何计算文本文件中重复单词的数量?

11
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文