开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

获取pandas列字符串中与预定义列表匹配的单词计数

可以通过以下步骤实现：

导入必要的库和模块：

import pandas as pd
import re

创建示例数据：

data = {'column_name': ['This is a sample string.', 'Another example string.', 'Yet another sample string.']}
df = pd.DataFrame(data)

定义预定义列表：

predefined_list = ['sample', 'string']

使用正则表达式和pandas的apply方法进行匹配和计数：

def count_matching_words(row):
    words = re.findall(r'\w+', row['column_name'])
    matching_words = [word for word in words if word.lower() in predefined_list]
    return len(matching_words)

df['word_count'] = df.apply(count_matching_words, axis=1)

查看结果：

print(df)

输出：

                 column_name  word_count
0    This is a sample string           2
1    Another example string           1
2  Yet another sample string           2

在上述代码中，我们首先导入了pandas和re模块。然后，创建了一个示例数据框，并定义了预定义列表。接下来，我们定义了一个名为count_matching_words的函数，它使用正则表达式找出每个字符串中的单词，并将与预定义列表匹配的单词计数。最后，我们使用apply方法将该函数应用于数据框的每一行，并将结果存储在名为word_count的新列中。

推荐的腾讯云相关产品和产品介绍链接地址：

云服务器（CVM）：提供基于云的可扩展计算服务。产品介绍链接
云数据库 MySQL：高性能、可扩展的关系型数据库服务。产品介绍链接
人工智能机器学习平台（AI Lab）：提供人工智能的开发环境和工具。产品介绍链接
云存储（COS）：安全、稳定、低成本的大规模数据存储和处理服务。产品介绍链接
区块链服务（BCS）：快速部署和管理区块链网络的服务。产品介绍链接
腾讯会议：基于云的在线会议和协作工具。产品介绍链接

相关搜索:使用python获取列表中单词字符串中的单词计数在pandas中匹配列列表中的单词并分配分数 pandas -获取重复行的计数(跨多列匹配)获取与列表值匹配的列索引将列与pandas数据帧中的列表进行匹配获取Pandas中唯一列表的计数获取数据帧中列值与列表匹配的每一行: Pandas 插入值列表与列列表不匹配: 1136列计数与第1行的值计数不匹配-但数字相同比较列中的pandas列表与外部列表如何获取与另一列的pandas df列中的子字符串匹配的字符串？将变量中的字符串列表与pandas表进行匹配修改与定义的字符串匹配的新列 Python |计算dataframe中与预先指定的单词列表匹配的单词字符串列表中的模式匹配，在pandas中创建新列如何获取与特定模式匹配的给定句子中特定单词的列表？获取Pandas DataFrame列中字符串列表中的所有行-此模式具有匹配组标识pandas数据帧列与字符串匹配的位置 Python Pandas:获取列与特定值匹配的多行的索引 scala -获取列表中单词的运行计数，并保留顺序值计数Python中列表类型的Pandas列的字符串出现次数

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

云+社区技术沙龙[第10期]
科技驱动教育，AI 连接未来 - 在线教育个性化教学技术实践
2018-06-23北京回顾中

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭