腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >按字长计算单词的Python

问按字长计算单词的Python
EN

Stack Overflow用户

提问于 2021-04-13 23:46:38

回答 2查看 632关注 0票数 3

我收到了一个带有文本的.txt文件。我已经清理了文本(去掉标点符号、大写字母、符号)，现在我有了一个带有单词的字符串。现在，我正在尝试获取字符串中每个项的字符len()的计数。然后绘制一个图，其中N个字符位于X轴上，Y轴是具有这样N个字符len()的单词数。

到目前为止，我已经：

text = "sample.txt"

def count_chars(txt):
    result = 0
    for char in txt:
        result += 1     # same as result = result + 1
    return result

print(count_chars(text))

到目前为止，这是在寻找文本的总len()，而不是按单词。

我想得到类似于函数计数器Counter()的东西，它返回单词，并计算它在整个文本中重复的次数。

from collections import Counter
word_count=Counter(text)

我想得到每个字的字符#。一旦我们有了这样的数字，策划就会容易一些。

谢谢，一切都有帮助！

matplotlib

python

腾讯云OCR文字识别特惠

文字识别限时抢购，热门产品低至14.9元

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-04-14 02:22:27

看起来被接受的答案并没有解决问题，因为它是由查询者提出的

然后，

绘制一个图，其中N个字符位于X轴上，Y轴是具有这样N个字符的字数。

import matplotlib.pyplot as plt

# ch10 = ... the text of "Moby Dick"'s chapter 10, as found
# in https://www.gutenberg.org/files/2701/2701-h/2701-h.htm

# split chap10 into a list of words,
words = [w for w in ch10.split() if w]
# some words are joined by an em-dash
words = sum((w.split('—') for w in words), [])
# remove suffixes and one prefix
for suffix in (',','.',':',';','!','?','"'):
    words = [w.removesuffix(suffix) for w in words]
words = [w.removeprefix('"') for w in words]

# count the different lenghts using a dict
d = {}
for w in words:
    l = len(w)
    d[l] = d.get(l, 0) + 1

# retrieve the relevant info from the dict 
lenghts, counts = zip(*d.items())

# plot the relevant info
plt.bar(lenghts, counts)
plt.xticks(range(1, max(lenghts)+1))
plt.xlabel('Word lengths')
plt.ylabel('Word counts')
# what is the longest word?
plt.title(' '.join(w for w in words if len(w)==max(lenghts)))

# T H E   E N D

plt.show()

票数 1

Stack Overflow用户

发布于 2021-04-13 23:56:51

好的，首先您需要打开sample.txt文件。

with open('sample.txt', 'r') as text_file:
    text = text_file.read()

或

text = open('sample.txt', 'r').read()

现在我们可以数一下课文中的单词，例如，放在一个小块里。

counter_dict = {}
for word in text.split(" "):
    counter_dict[word] = len(word)
print(counter_dict)

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/67087535

复制

python 获取环境变量

python

参考 https://docs.python.org/2/library/os.html

py3study

2020/01/06

8700

如何在单元测试中设置系统环境变量

其他

有时我们需要通过读取系统环境变量来获取一些有用的信息，比如系统路径、临时目录等。在系统真正运行的时候我们可以通过启动命令行，如：java -Dxxx.xxx=xxxx …，或者使用System.setProperty(“xxx.xxx”, “xxx.xxx”)来设置系统环境变量。但在单元测试时如何设置这些系统环境变量又成了一个让人头疼的问题。有些小伙伴是在setUp方法里设置，比如：

Allen Cheng

2018/09/10

8.1K0

iOS开发-获取全部环境变量iOS开发-获取全部环境变量

编程算法数据分析缓存 objective-c

在Xcode中选中Target然后打开Edit Scheme，当前打开OBJC_PRINT_LOAD_METHODS环境变量。

用户8893176

2021/08/09

1.6K0

如何在gin中获取响应体内容？

实现思路：对gin的responseWriter进行包装，每次写往请求方写响应数据的时候，将响应数据返回出去。step1：定义一个新的CustomResponseWriter，通过组合方式持有一个gin.ResponseWriter和response body缓存。type CustomResponseWriter struct { gin.ResponseWriter body *bytes.Buffer}func (w CustomResponseWriter) Write(b []byt

Johns

2021/04/10

11.7K0

如何在Bash中获取数组长度？

bash

在Bash脚本中，数组是一种常用的数据结构，用于存储多个值。在处理数组时，经常需要知道数组的长度，即数组中元素的个数。本文将详细介绍如何在Bash中获取数组长度的方法，以帮助您更好地处理数组操作。

网络技术联盟站

2023/06/17

1.3K0

PHP - 环境变量获取参数

php bash bash 指令容器镜像服务

如果fpm是用sudo方式启动，默认sudo会禁用一些环境变量，可以通过以下方式放开限制

断痕

2021/01/21

1.8K0

如何在windows下和linux下获取文件(如exe文件)的详细信息和属性

linux

最近在项目开发中,由cs开发的exe的程序，需要自动升级，该exe程序放在linux下，自动升级时检测不到该exe程序的版本号信息，但是我们客户端的exe程序需要获取服务器上新程序的版本号信息。最后由我用java实现linux上exe文件的版本号读取功能。下面是详细代码：

业余草

2019/01/21

6K0

如何在Java中获取context-param值？

https 网络安全 java 网站 xml

“ context-param”标记在“ web.xml”文件中定义，并且为整个Web应用程序提供参数。

全栈程序员站长

2022/09/13

2.9K0

如何在 React 中获取点击元素的 ID？

react

在 React 应用中，我们经常需要根据用户的点击事件来执行相应的操作。在某些情况下，我们需要获取用户点击元素的唯一标识符（ID），以便进行进一步的处理。本文将详细介绍如何在 React 中获取点击元素的 ID，并提供示例代码帮助你理解和应用这个功能。

网络技术联盟站

2023/06/07

3.5K0

如何在小程序中获取用户信息

小程序微信 javascript

在以前的文章中，我们介绍了小程序的登录鉴权功能，方便开发者去获取用户的appid和session_key以便确认用户的身份。但是，仅仅通过appid和session_key不能去获取用户的信息。那么，这篇文章中，我们将介绍如何在小程序中获取用户的昵称、头像、性别、城市等信息。

it大叔

2019/01/25

6.7K0

Jenkins Python Plugin获取环境变量

python jenkins http

官方wiki：https://wiki.jenkins-ci.org/display/JENKINS/Python+Plugin

donghui

2019/04/19

2.1K0

教你如何在linux配置环境变量

export path profile vim

输入下面命令 cd /etc/ vim profile 在末尾添加环境变量 PATH="$PATH:路径" export PATH 保存退出重新加载环境变量 source /etc/profile

切图仔

2022/09/08

2.6K0

python获取linux环境变量_linux如何设置环境变量

python 编程算法 https linux

为了演示我的意思,采用两个大致相同的程序(C中的第一个,python中的另一个)：

全栈程序员站长

2022/11/10

8.4K0

Request.ServerVariables获取环境变量

http https 网络安全 tcp/ip 数据库

本文由来源 21aspnet，由 javajgs_com 整理编辑，其版权均为 21aspnet 所有，文章内容系作者个人观点，不代表 Java架构师必看对观点赞同或支持。如需转载，请注明文章来源。

Java架构师必看

2021/03/22

6800

如何在Power Query中获取数据——表格篇(7)

nullable select table text transform

Table.SelectRowsWithErrors(tableas table,optional columns as nullable list)as table

逍遥之

2020/03/23

2.5K0

如何在小程序中添加广告并获取收益

小程序微信网站

业余草

2019/05/07

5.3K0

pandas | 如何在DataFrame中通过索引高效获取数据？

python

上篇文章当中我们简单介绍了一下DataFrame这个数据结构的一些常见的用法，从整体上大概了解了一下这个数据结构。今天这一篇我们将会深入其中索引相关的应用方法，了解一下DataFrame的索引机制和使用方法。

TechFlow-承志

2020/07/10

13.7K0

如何在Power Query中获取数据——表格篇(3)

record table text

Table.Last(table as table, optionaldefault as any)as any

逍遥之

2020/03/23

2.5K0

如何在Power Query中获取数据——表格篇(1)

list table

Table.ColumnNames(table as table) as list

逍遥之

2020/03/23

3.2K0

点击加载更多

相似问题

jQuery移动版动态更改按钮颜色

更改jquery移动滑块微调按钮的颜色

单击jQuery移动设备时更改按钮颜色

jquery移动按钮背景颜色

jquery移动css。更改颜色

活动推荐

体验智能媒资降冷，云点播优惠不要错过！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问按字长计算单词的Python
EN

腾讯云OCR文字识别特惠

回答 2

Stack Overflow用户

Stack Overflow用户

jQuery移动版动态更改按钮颜色

更改jquery移动滑块微调按钮的颜色

单击jQuery移动设备时更改按钮颜色

jquery移动按钮背景颜色

jquery移动css。更改颜色

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问按字长计算单词的PythonEN

腾讯云OCR文字识别特惠

回答 2

Stack Overflow用户

Stack Overflow用户

jQuery移动版动态更改按钮颜色

更改jquery移动滑块微调按钮的颜色

单击jQuery移动设备时更改按钮颜色

jquery移动按钮背景颜色

jquery移动css。更改颜色

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问按字长计算单词的Python
EN