首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

统计pandas df列中子字符串列表的出现次数

可以使用pandas库中的str.contains()str.count()方法来实现。

首先,使用str.contains()方法筛选出包含子字符串的行,然后使用str.count()方法统计每个子字符串在列中出现的次数。

以下是一个示例代码:

代码语言:txt
复制
import pandas as pd

# 创建示例数据
data = {'col1': ['apple', 'banana', 'orange', 'apple,banana', 'banana,orange']}
df = pd.DataFrame(data)

# 子字符串列表
substrings = ['apple', 'banana']

# 统计子字符串列表在列中的出现次数
counts = {}
for substring in substrings:
    df_subset = df[df['col1'].str.contains(substring)]
    count = df_subset['col1'].str.count(substring).sum()
    counts[substring] = count

# 打印结果
for substring, count in counts.items():
    print(f"子字符串 '{substring}' 出现的次数为: {count}")

输出结果为:

代码语言:txt
复制
子字符串 'apple' 出现的次数为: 2
子字符串 'banana' 出现的次数为: 3

在这个例子中,我们创建了一个包含字符串的DataFrame,并定义了一个子字符串列表。然后,我们遍历子字符串列表,使用str.contains()方法筛选包含子字符串的行,并使用str.count()方法统计每个子字符串在列中出现的次数。最后,打印出每个子字符串的出现次数。

请注意,这只是一个示例代码,实际应用中需要根据具体情况进行调整。另外,腾讯云提供了多个与数据处理和分析相关的产品,例如云数据库 TencentDB、云原生数据库 TDSQL、云数据仓库 CDW 等,可以根据具体需求选择适合的产品。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

excel中相同字符串统计_输入一串字符统计出现次数

https://jingyan.baidu.com/article/6d704a132ea17328da51ca78.html 通过excel快速统计中相同字符个数,如果很少,你可以一个一个数、筛选方法...2 在B2单元格输入“=countif(” 3 选择A全部数据,显示结果如右图所示, 4 选择要统计单元格,选择A2单元格。结果如图所示。...5 此时,按下键盘上回撤Enter键,完成统计。...END 数据填充与整理 1 用鼠标按住B2单元格右下角+号,往下拖动填充,也可以选择所有要统计单元格,按下组合件Ctrl+D进行向下填充。...END 数据去重与数据排列 1 此时,选中AB两,点击“数据——删除重复项” 2 选择要删除重复项“数”,点击确定。然后点击确定,效果如图所示。

1.8K10

c++统计字符串中某个字符出现次数_统计字符串出现次数

参考链接: C++程序查找字符串中字符频率 手机边亲爱大家好!   今天我要给大家分享一个示例:统计出某个字符串在某表某字段中出现次数。  ...大家先来看一下结果效果图:   先来讲一下原理,其实就是循环数据库中所有表,然后找模糊查找,找到了就记录表名、表中字段、统计出现次数。  ...知道了原理就可以开始做了,今天我们换个套路,不要再之前一步一步方式来教大家了,只告诉关键步骤。0   1表   其中,我们要建一张表,用于保存统计数据,具体查看截图。  ...0   2函数   这次代码只分享给大家一个关键函数,然后大家自己去调用一下   查找函数    1Private Sub Snoop(SnoopFor As String) 2 3    On Error...Err.Description, vbCritical70    Resume Snoop_Exit7172    Exit Sub7374End Sub0   3测试   最后一步就是测试了,大家可以将按上面的步骤,在按钮控件单击事件里来调用上面的函数

3.4K20

Python count()方法:统计字符串出现次数

count 方法用于检索指定字符串在另一字符串出现次数,如果检索字符串不存在,则返回 0,否则返回出现次数。...count 方法语法格式如下: str.count(sub[,start[,end]]) 1 此方法中,各参数具体含义如下: str:表示原字符串; sub:表示要检索字符串; start:指定检索起始位置...如果不指定,默认从头开始检索; end:指定检索终止位置,如果不指定,则表示一直检索到结尾。 【例 1】检索字符串“c.biancheng.net”中“.”出现次数。...',2) 1 1 2 3 4 5 前面讲过,字符串中各字符对应检索值,从 0 开始,因此,本例中检索值 1 对应是第 2 个字符‘.’

2.5K30

每日一题--统计字符串出现次数

使用awk统计出来指定字符串中重复出现字符并重复出现了几次,现在只考虑有数字和字母,先区分大小写 eg: aaabbc------> a 重复出现3次,b重复出现了2次 abababdcac--> a...重复出现了4次,b重复出现了3次,c重复出现了2次 第一个里程碑: 先不考虑样式和要求,先输出所有字符串出现次数 //我们先使用awk把单个字符串取出来 [root@web01-7 /]# echo..."" '{for(i=1;i<=NF;i++){sum[$i]++}}END{for(j in sum)print sum[j],j}' 3 a 2 b 1 c //使用awk数据求和来取出每个字母出现次数...,并输出 第二个里程碑: 把重复出现2次以上给打印出来,只出现1次不打印 [root@web01-7 /]# echo "aaabbc" | awk -F "" '{for(i=1;i<=NF;i...s次\t",j, sum[j]} printf"\n"}' 进阶版:不区分大小统计(应该能简化??)

1.8K40

【刷题】统计每个元音字母在字符串出现次数【2】

【刷题】统计每个元音字母在字符串出现次数【2】 一、题目 1.题目描述 二、解题报告 1.思路分析 2.代码详解 3.注意事项C++ 一、题目 1.题目描述 题目:统计每个元音字母在字符串出现次数...输入:输入数据首先包括一个整数n,表示测试实例个数,然后是n行长度不超过100字符串 输出: 示例 : 二、解题报告 1.思路分析 循环进行通过switch匹配计数 2.代码详解...}else{ printf("a:%d\ne:%d\ni:%d\no:%d\nu:%d\n",a,e,i,o,u) ; } } } 3.注意事项C++ 输入测试是字符串...,而且输入是带有空格句子 要用C++内置函数gets()进行输入,gets()可以无限读取,以回车结束读取。...注意对于输入完样例次数那个回车,gets会将它作为输入,所以要多加一个gets吸收这个回车 字符串初始化char s[1000] 判断句子结束用 最后一个字符=‘\0’ 输出格式 之前多次测试实例有一个空行隔开

87620

Pandas数据处理——通过value_counts提取某一出现次数最高元素

这个图片来自于AI生成,我起名叫做【云曦】,根据很多图片进行学习后生成  Pandas数据处理——渐进式学习——通过value_counts提取某一出现次数最高元素 ---- 目录 Pandas...数据处理——渐进式学习——通过value_counts提取某一出现次数最高元素 前言 环境 基础函数使用 value_counts函数 具体示例 参数normalize=True·百分比显示 参数...Pandas处理,在最基础OpenCV中也会有很多Pandas处理,所以我OpenCV写到一般就开始写这个专栏了,因为我发现没有Pandas处理基本上想好好操作图片数组真的是相当麻烦,可以在很多...AI大佬文章中发现都有这个Pandas文章,每个人写法都不同,但是都是适合自己理解方案,我是用于教学,故而我相信我文章更适合新晋程序员们学习,期望能节约大家事件从而更好将精力放到真正去实现某种功能上去...,只适用于数字数据 dropna : 对元素进行计数开始时默认空值 具体示例 模拟数据 import pandas as pd import numpy as np df = pd.DataFrame

1.3K30

建议收藏:12个Pandas数据处理高频操作

简单说说 总结分享 > 1 统计一行/一数据负数出现次数 > 2 让dataframe里面的正数全部变为0 > 3 统计中各元素出现次数 > 4 修改表头和索引 > 5 修改所在位置insert...pip install pandas 在Python代码中使用pandas首先需要导入,: import pandas as pd 创建一个示例数据: # 统计一行/一数据负数出现次数 df...统计一行/一数据负数出现次数 # 获取到每一行复数个数 # 要获取的话,将axis改成0即可 num_list = (df < 0).astype(int).sum(axis=1) num_list...> 2 让dataframe里面的正数全部变为0 # 直接了当 df[df>0] = 0 df > 3 统计中各元素出现次数 默认情况,直接统计出指定各元素值出现次数。...# 默认情况,统计b各元素出现次数 df['b'].value_counts() 最好奇bins参数,按bins分割区间,统计落在各区间内元素个数 # 按指定区间个数bin,元素起始值分割区间,

2.6K20

Python常用小技巧总结

小技巧 pandas生成数据 导入数据 导出数据 查看数据 数据选择 数据处理 数据分组 数据合并 数据替换--map映射 数据清洗--replace和正则 数据透视表分析--melt函数 将分类中出现次数较少值归为...合并字典 字符串分割成列表 字符串列表创建字符串 Python查看图片 itertools模块combinations itertools中reduce 字典.get()方法 解压zip压缩包到指定文件路径...查看数值型汇总统计 s.value_counts(dropna=False) # 查看Series对象唯⼀值和计数 df.apply(pd.Series.value_counts) # 查看...Liu B 7 Wang C 8 Jack A 9 Wsx E 10 Guo F D、E、F 仅在分类中出现一次,A 出现次数较多。...统计出现次数,并标准化 frequencies = df["categories"].value_counts(normalize=True) frequencies A 0.363636 B

9.4K20

疫情这么严重,还不待家里学Numpy和Pandas

'] salesDf['商品名称'] #通过列表来选择某几列数据 salesDf[['商品名称','销售数量']] #通过切片功能,获取指定范围 salesDf.loc[:,'购药时间':'销售数量...salesDf.loc[:,'销售数量'].dtype #查看每一统计数值 salesDf.describe() ?.../pandas-docs/stable/generated/pandas.DataFrame.dropna.html #删除(销售时间,社保卡号)中为空行 #how='any' 在给定任何一中有缺失值就删除...,'销售时间'] #对字符串进行分割,获取销售日期 dateSer=splitSaletime(timeSer) #修改销售时间这一值 salesDf.loc[:,'销售时间']=dateSer...=总消费次数 / 月份数 kpilDf=salesDf.drop_duplicates( subset=['销售时间','社保卡号'] ) #总消费次数:有多少行 totalI=kpi1_Df.shape

2.5K41
领券