统计pandas df列中子字符串列表的出现次数

可以使用pandas库中的str.contains()和str.count()方法来实现。

首先，使用str.contains()方法筛选出包含子字符串的行，然后使用str.count()方法统计每个子字符串在列中出现的次数。

以下是一个示例代码：

import pandas as pd

# 创建示例数据
data = {'col1': ['apple', 'banana', 'orange', 'apple,banana', 'banana,orange']}
df = pd.DataFrame(data)

# 子字符串列表
substrings = ['apple', 'banana']

# 统计子字符串列表在列中的出现次数
counts = {}
for substring in substrings:
    df_subset = df[df['col1'].str.contains(substring)]
    count = df_subset['col1'].str.count(substring).sum()
    counts[substring] = count

# 打印结果
for substring, count in counts.items():
    print(f"子字符串 '{substring}' 出现的次数为: {count}")

输出结果为：

子字符串 'apple' 出现的次数为: 2
子字符串 'banana' 出现的次数为: 3

在这个例子中，我们创建了一个包含字符串的DataFrame，并定义了一个子字符串列表。然后，我们遍历子字符串列表，使用str.contains()方法筛选包含子字符串的行，并使用str.count()方法统计每个子字符串在列中出现的次数。最后，打印出每个子字符串的出现次数。

请注意，这只是一个示例代码，实际应用中需要根据具体情况进行调整。另外，腾讯云提供了多个与数据处理和分析相关的产品，例如云数据库 TencentDB、云原生数据库 TDSQL、云数据仓库 CDW 等，可以根据具体需求选择适合的产品。

统计pandas df列中子字符串列表的出现次数

python、string、pandas、dataframe

我想要计算子字符串列表在包含长字符串的列中出现的次数，并在pandas df中创建一个count列 ID History 1

浏览 11提问于2019-07-27得票数 1

回答已采纳

3回答

分类变量pandas摘要

python、pandas

正如标题中所述，我想对pandas中的分类变量进行一些总结分析，但经过一段时间的搜索仍未找到令人满意的解决方案。因此，我开发了以下代码，作为一种自我回答的问题，希望有这样的人可以帮助改进。':['Jay', 'Jade', 'Jia', ''],def cat_var_describe(input_df

浏览 15提问于2020-10-06得票数 1

2回答

如何使用列表理解在满足条件时递增分数

python、python-3.x、list、list-comprehension

“编写程序统计mystring中子字符串出现的次数” mystring = "abcdcdcdc"score = 0 if mystring[i : i + ss_len] == substring:print(score) 你好, 如何使用列表理解来编写上述工作代码这返

浏览 25提问于2020-06-10得票数 0

回答已采纳

4回答

标识列中出现频率最高的值(字符串)

python、pandas、group-by、pandas-groupby、data-science

我有一个csv格式的非常大的数据集(10 GB)，其中包含各种列和行。其中一列是某类个人的is (表示为字符串)。ID在数据中都是加扰的，并且每个单独的ID可能会多次出现。我想要找到数据中出现频率最高的个人的ID。理想情况下，我希望计算每个ID在数据集中出现的次数。最后，我还想对各个‘d进行统计分析。完成这项任

浏览 1提问于2019-02-22得票数 0

1回答

统计pandas数据帧中子元素的出现次数

python、dataframe

我有一个熊猫数据框-----javascript|html|React我需要按groupby_tags={'c#','.net','python'}计数

浏览 0提问于2020-08-13得票数 0

1回答

计数数组在PySpark中每个类别包含字符串的次数

pyspark

我从spark数组“df_spark”开始： from pyspark.sql import SparkSessionimport numpy as nprows = 6df_spark = spar

浏览 19提问于2018-12-16得票数 3

回答已采纳

4回答

统计pandas数据帧中特定单词的出现次数

python、pandas

我想使用下面的代码来计算数据帧的每一行提到单词列表的次数 df["Count"] = ( .apply(Counter)) 单词是我使用的单词列表。words = ['wooly', 'gi

浏览 58提问于2021-05-03得票数 0

1回答

如何将包含其他列中的值出现次数的列附加到现有的Dataframe？

python、python-3.x、pandas、dataframe

我想实现一个基于统计特征的过滤器，因此我必须计算(0, 1)列的所有匹配项，分别计算下位词和上义词部分的所有匹配项。Pandas有一个名为value_counts()的方法，因此可以通过以下方法计算出现次数： df.value_counts([0])df.value_counts([0, 1]) 这很好，但是这个方法产生的</em

浏览 17提问于2021-09-22得票数 1

回答已采纳

2回答

计算pandas数据帧中每单位时间的出现率

python、pandas、counting

我正在计算数据帧中事件发生的速率。我在熊猫中有一个数据框架，可以跟踪某个事件的开始和持续时间。channels表示我要循环遍历的一组唯一的组。time frame) 'A3': 0.1 } 我到目前为止的尝试首先，我获得了一个基于channels的组 foridx, group in df.groupby(['channels'

浏览 22提问于2021-02-11得票数 3

回答已采纳

2回答

获取Pandas中唯一列表的计数

python、pandas、numpy、pivot

我有一个pandas Dataframe，其中一列充满了列表： import pandas [3, [a, b, c]]]) 我想做一个数据透视表，显示列表和出现次数的计数 List Count[d,e,f] 1 因为lis

浏览 9提问于2021-01-13得票数 0

1回答

从字典和熊猫中计算出现的次数

pandas、dictionary

我对pandas和python仍然是个新手，我想统计一下在单个字典中相同的变量组合在多个DataFrames中出现的总次数。DO-PSPCp PT-WFrTo -0.067934

浏览 0提问于2017-03-28得票数 0

3回答

计数pandas数据框中跨多列的唯一值的出现次数

python、pandas、dataframe

我在pandas中有以下数据框架我想<

浏览 6提问于2018-02-03得票数 1

回答已采纳

1回答

R-标识部分字符串匹配的其余部分或查找列中的部分重复项

r、regex

我想在“样本”的基础上生成“复制”列。003是样本ID，003r是同一样本的复制品。" sample“列中复制的样本名称的前3个字符是相同的。001","002","003","003r","004","005","005r")Duplicate <- c(F,F,T

浏览 3提问于2017-03-12得票数 0

4回答

在Pandas* DataFrame中搜索子字符串最有效的方法是什么？*

python、string、pandas、dataframe、series

我有一个Pandas包含75k行文本(大约。(每一行350字符)。我需要搜索在该数据帧中出现的45k子字符串列表。for auth

浏览 1提问于2018-08-14得票数 4

回答已采纳

3回答

保留在列中出现最多项的熊猫数据行

python、pandas、dataframe

我有一只熊猫df['cluster'].valu

浏览 7提问于2022-05-29得票数 2

回答已采纳

1回答

总结与python重叠部分

python、pandas、overlap

这是DNA序列表。我想分析一下它们，因为group1和group2是成对的。例如，AAATTT_TTTCCC或GGGCCC_GGAAA是成对的。

浏览 2提问于2017-01-28得票数 2

2回答

计算子字符串的出现次数

c++、c

有没有一种有效的算法来统计一个更长的字符串Y中子字符串X出现的总次数？答案是2:第一个A和第二个B，第

浏览 1提问于2013-10-16得票数 1

2回答

统计pandas* DataFrame中整行的出现次数*

python、pandas、dataframe

我需要计算pandas DataFrame中整行的出现次数。pd.DataFrame([['a','b','c'],['b','a','c'],['a','b','c']]) 预期结果应该是： 'a'，'b'，'c‘：2 'b'，'a'，'c‘：1

浏览 133提问于2021-08-03得票数 1

回答已采纳

2回答

将大字符串分成较小的块，并计算每个块php？

php、mysql、codeigniter、symfony1

我想把大的字符串分成更小的块，并统计每个块在数据库中的出现次数示例：现在我要在所有数据库的“答案”栏中统计Windows，Apple，Android的出现次数。答案列中的字符串可能并不总是固定的，它将取决于答案！

浏览 9提问于2014-09-11得票数 0

1回答

pandas groupby count字符串出现在列上

python、pandas、count、group-by、dataframe

我想计算一个分组的pandas dataframe列中字符串的出现次数。对于这些组中的每个组，我希望在scores列中计算RET的出现次数。结果应该如下所示：A X 1B Z 2 按两列分组很容易：grouped= df

浏览 1提问于2015-07-27得票数 13

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

统计pandas df列中子字符串列表的出现次数

相关·内容

统计pandas df列中子字符串列表的出现次数

分类变量pandas摘要

如何使用列表理解在满足条件时递增分数

标识列中出现频率最高的值(字符串)

统计pandas数据帧中子元素的出现次数

计数数组在PySpark中每个类别包含字符串的次数

统计pandas数据帧中特定单词的出现次数

如何将包含其他列中的值出现次数的列附加到现有的Dataframe？

计算pandas数据帧中每单位时间的出现率

获取Pandas中唯一列表的计数

从字典和熊猫中计算出现的次数

计数pandas数据框中跨多列的唯一值的出现次数

R-标识部分字符串匹配的其余部分或查找列中的部分重复项

在Pandas* DataFrame中搜索子字符串最有效的方法是什么？*

保留在列中出现最多项的熊猫数据行

总结与python重叠部分

计算子字符串的出现次数

统计pandas* DataFrame中整行的出现次数*

将大字符串分成较小的块，并计算每个块php？

pandas groupby count字符串出现在列上

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐