在pandas中,可以使用str.contains()
方法来实现文本列与列表中单词的匹配,并保留匹配到的结果。
首先,需要导入pandas库并创建一个DataFrame对象,其中包含文本列和单词列表:
import pandas as pd
# 创建DataFrame对象
df = pd.DataFrame({'text_column': ['This is a sample text', 'Another example', 'Some text here']})
word_list = ['sample', 'text']
接下来,可以使用str.contains()
方法来进行匹配,并将匹配结果保存到一个新的列中:
# 使用str.contains()方法进行匹配
df['matched_words'] = df['text_column'].str.contains('|'.join(word_list))
在上述代码中,'|'.join(word_list)
将单词列表转换为一个正则表达式,用于匹配文本列中的单词。匹配到的结果将保存在名为matched_words
的新列中。
最后,可以打印DataFrame对象来查看匹配结果:
print(df)
输出结果如下:
text_column matched_words
0 This is a sample text True
1 Another example False
2 Some text here True
在这个例子中,第一行和第三行的文本与单词列表中的单词匹配成功,所以matched_words
列中对应的值为True,而第二行的文本没有与单词列表中的任何单词匹配,所以对应的值为False。
推荐的腾讯云相关产品:腾讯云云服务器(CVM)和腾讯云数据库(TencentDB)。腾讯云云服务器提供了可靠、安全、高性能的云服务器实例,可满足各种计算需求。腾讯云数据库提供了多种数据库产品,包括关系型数据库、NoSQL数据库和数据仓库等,可满足不同的数据存储和管理需求。
腾讯云云服务器产品介绍链接地址:https://cloud.tencent.com/product/cvm 腾讯云数据库产品介绍链接地址:https://cloud.tencent.com/product/tencentdb
领取专属 10元无门槛券
手把手带您无忧上云