如何比较Python dataframe中的子字符串以创建新列？

在Python中，可以使用pandas库来处理数据框（dataframe）。要比较dataframe中的子字符串并创建新列，可以使用pandas的apply函数结合lambda表达式来实现。

下面是一个示例代码，演示如何比较dataframe中的子字符串以创建新列：

import pandas as pd

# 创建示例数据框
data = {'Name': ['John', 'Mike', 'Sarah', 'Amy'],
        'Age': [25, 30, 35, 40],
        'City': ['New York', 'London', 'Paris', 'Tokyo']}
df = pd.DataFrame(data)

# 定义一个函数，用于比较子字符串
def compare_substring(text, substring):
    if substring in text:
        return True
    else:
        return False

# 使用apply函数和lambda表达式创建新列
df['Has_Substring'] = df['Name'].apply(lambda x: compare_substring(x, 'oh'))

# 打印结果
print(df)

输出结果如下：

   Name  Age      City  Has_Substring
0  John   25  New York           True
1  Mike   30    London          False
2  Sarah  35     Paris          False
3  Amy    40     Tokyo          False

在上述示例中，我们首先创建了一个包含姓名、年龄和城市的数据框。然后，定义了一个函数compare_substring，该函数接受一个字符串和一个子字符串作为参数，并返回子字符串是否存在于字符串中的布尔值。接下来，使用apply函数和lambda表达式将该函数应用于Name列的每个元素，以创建一个新的Has_Substring列，该列指示每个姓名是否包含子字符串"oh"。

这是一个简单的示例，你可以根据实际需求进行修改和扩展。关于pandas的更多信息和用法，请参考腾讯云的相关产品和文档：

腾讯云·云服务器CVM：提供高性能、可扩展的云服务器实例，适用于各种计算场景。
腾讯云·云数据库MySQL：提供稳定可靠的云数据库服务，支持高性能、高可用的MySQL数据库。
腾讯云·云函数SCF：无服务器云函数服务，可实现按需运行代码，无需管理服务器。
腾讯云·云存储COS：提供安全可靠、高扩展性的对象存储服务，适用于各种数据存储需求。
腾讯云·人工智能：提供丰富的人工智能服务，包括图像识别、语音识别、自然语言处理等。
腾讯云·物联网IoT：提供全面的物联网解决方案，帮助连接和管理物联网设备。
腾讯云·区块链：提供安全可信赖的区块链服务，支持快速搭建和管理区块链网络。
腾讯云·元宇宙：提供虚拟现实（VR）和增强现实（AR）技术，构建沉浸式的元宇宙体验。

请注意，以上链接仅作为示例，实际情况下可能需要根据具体需求选择适合的腾讯云产品。

如何比较Python dataframe中的子字符串以创建新列？

、、

一列" team“包含球员所属的团队，另一列"Game Info”包含有关游戏的信息。Game Info列如下所示 SAC@HOU 12/09/2019东部时间08:00 而Team列可以包含"SAC“或"HOU”。我正在尝试创建一个包含对手的新列。目前我尝试的是 df.insert(7, "Opp", '&#

浏览 12提问于2019-12-09得票数 0

回答已采纳

1回答

如果数据帧存在于另一数据帧列中，则搜索该数据帧的子串

、、、、

我需要一些帮助，在dataframe1的化学物质列中搜索字符串或子字符串，并检查它是否存在于dataframe2中，然后在dataframe1中创建一个新列，以从dataframe2返回相应的化学物质名称列

浏览 6提问于2020-10-07得票数 0

回答已采纳

1回答

检查字符串以在中创建新列。

、、、、

我有一个带有交易对的Spark dataframe列，我需要使用它来创建一个新列，其中包含硬币的名称。第一列" bot“包含"Polkadot/USD"，我需要一个名为”硬币“的新列，它只包含bot列的子字符串"Polkadot”。其他行也一样。基本上，新<em

浏览 2提问于2021-07-26得票数 1

回答已采纳

1回答

使用Python向子字符串添加值的建议

、、

我正在寻找关于如何让python将子字符串中的空空间转换为破折号(-)的建议。在下面的dataframe列中，A有原始数据，需要向其中有空格的子字符串中添加一个破折号，以获得列B。

浏览 0提问于2019-04-25得票数 1

回答已采纳

1回答

循环遍历dataframe以提取匹配字典的子字符串

、、、、

我试图在dataframe中循环一列，如果它包含字典中的值，则使用环列中的子字符串创建一个新列。更具体地说，如果地址列中的单个行在州名和缩写字典中包含状态，则将状态缩写附加到将成为新列的列表中。下面的代码适用于完全匹配，但不扫描行以

浏览 0提问于2016-05-03得票数 1

回答已采纳

1回答

熊猫使用单独的dataframe的值来搜索子字符串。

、、、

基本上，我有一个带有多个工作表的excel电子表格，对于这个python程序，我只关心其中的两个，更具体地说，每个表中有一列。我想从一个dataframe/column ( A )中获取所有值，并查看第二个dataframe/column ( B )是否包含来自A列的该值的子字符串。最终，我想要一个csv输出，其中包含A列的行

浏览 2提问于2022-05-24得票数 0

回答已采纳

1回答

根据接受字典作为输入的自定义例程计算熊猫DataFrame列

、

有熊猫DataFrame，有数字栏A1和A2。步骤1.为DataFrame中的每一行创建python字典。如果您对常规的pack感到好奇，请在这里定义，但这不重要。步骤3：存储由pack例程在新的DataFrame列中

浏览 3提问于2017-10-20得票数 0

回答已采纳

1回答

基于Spark Dataframe中的条件创建新列

、、、

如何根据给定条件在Dataframe DF中创建新列。我有字符串数组，并希望将其与现有数据帧进行比较 | DiffColumnName|ORIGIN_COUNTRY_NAME| StringType| +---------------

浏览 15提问于2021-05-30得票数 0

回答已采纳

1回答

如果现有列的值包含特定子字符串，则创建新的pd.DataFrame列

、、、

我有一个DataFrame，如下所示：0 cat 2 tree4 flowersubstring1 = 'cat|og'生

浏览 10提问于2020-03-04得票数 1

回答已采纳

2回答

搜索DataFrame列中的单词，忽略regex和子字符串

、、

我有一个编程语言列表，我想检查一个dataframe列是否包含上述语言(如果有，创建一个以语言作为列名的新的空列)。然而，我遇到了两个问题：我只想找到匹配的单词，但不是子字符串。如何只匹配特定的单词(例如，如果单词为“Teapot”，编程语言“Teapot”就不应该返回True

浏览 9提问于2022-02-02得票数 0

1回答

从列表中删除重复子字符串

、、、

我有一个带有product_type列的dataframe，该列在字符串中包含重复的子字符串：product_typetote bag,bag df_1['unique_type']

浏览 7提问于2022-09-08得票数 0

回答已采纳

2回答

Pandas遍历行，将列值与列表中的字符串进行比较，从另一列返回值

、、、

目前，我正在尝试迭代数据框，将字符串列表中的每个值与数据框中某一列中的值进行比较。如果比较结果为真，则将同一行的不同列中的值附加到单独的列表中。list_of_words = 'yes', 'no', 'maybe' for wo

浏览 35提问于2019-03-10得票数 1

回答已采纳

1回答

Pandas中excel数据集的比较

、、

Python非常新，但作为SEO，我正在研究在我的工作流程中使用笔记本的好处。看一看截图[！下面的数据。提前谢谢。📷

浏览 0提问于2020-01-19得票数 1

回答已采纳

1回答

访问dataframe列中的子串以创建新列

、、

我有一个数据框 df = pd.DataFrame(np.random.randint(0,10,size=(5, 1)), columns=list('A'))4 2 我想创建一个新的专栏new A 0 this-text 2

浏览 9提问于2020-12-02得票数 0

4回答

重建熊猫达达菲

、、

我对Python很陌生。我在重建一个坏数据仓库上遇到了麻烦。我的Dataframe看起来是这样的： '其他值也是一样的。我的目标是创建一个Dataframe，其中每个

浏览 6提问于2020-11-05得票数 3

回答已采纳

1回答

pandas:一列是另一列的子字符串

、、

我正在尝试测试一列(surname)是否是dataframe (el)中另一列(name)的子字符串。我尝试过以下方法，但python不喜欢它 el.name.str.contains(el.surname) 我可以看到许多关于如何搜索文字子字符串的示例，但在子字符串是列的情况下却看不到。

浏览 20提问于2020-07-24得票数 1

回答已采纳

1回答

比较两列以在Spark DataFrame中创建新列

、、

我有一个有2列的Spark DataFrame，我正在尝试创建一个新列，使用when otherwise操作的另外两列。Cannot convert column into bool: please use '&' for 'and', '|' for 'or', '~' for 'not' when building <em

浏览 5提问于2018-01-23得票数 4

回答已采纳

2回答

将列中的值用作另一列熊猫的字符串裁剪器

、、、

我正在尝试使用一个单元格值作为新列中字符串的切片。例如，如果我创建了这个表。This is a title -5data['Test'] = data.Name.str[:data.Number.item()]0 This is a tit

浏览 14提问于2022-07-05得票数 1

回答已采纳

2回答

将三列和输出作为1或0进行比较

b <- c("33-22", "33-22", "44-33")df <- data.frame(a,b,c) 嗨，我有一个这样的dataframe，我想比较三列，使用特定的子字符串沿行，并给我一个新的列，逻辑

浏览 3提问于2017-06-30得票数 0

回答已采纳

2回答

选择“熊猫行”，其中列为子字符串

、

我希望过滤我的数据，以便只选择包含另一个字符串的子字符串的列的行。我知道这样做会适得其反：但是，我将如何做到子字符串在dataframe中，并将其与另一个字符串进行比较。我试过的是a = pan

浏览 4提问于2022-02-10得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何比较Python dataframe中的子字符串以创建新列？

相关·内容

如何比较Python dataframe中的子字符串以创建新列？

如果数据帧存在于另一数据帧列中，则搜索该数据帧的子串

检查字符串以在中创建新列。

使用Python向子字符串添加值的建议

循环遍历dataframe以提取匹配字典的子字符串

熊猫使用单独的dataframe的值来搜索子字符串。

根据接受字典作为输入的自定义例程计算熊猫DataFrame列

基于Spark Dataframe中的条件创建新列

如果现有列的值包含特定子字符串，则创建新的pd.DataFrame列

搜索DataFrame列中的单词，忽略regex和子字符串

从列表中删除重复子字符串

Pandas遍历行，将列值与列表中的字符串进行比较，从另一列返回值

Pandas中excel数据集的比较

访问dataframe列中的子串以创建新列

重建熊猫达达菲

pandas:一列是另一列的子字符串

比较两列以在Spark DataFrame中创建新列

将列中的值用作另一列熊猫的字符串裁剪器

将三列和输出作为1或0进行比较

选择“熊猫行”，其中列为子字符串

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐