通过匹配字典列表中的子字符串来映射pandas列

，可以使用pandas的map()函数。该函数可以将字典列表中的键值对应到pandas列中的值，实现映射关系。

具体步骤如下：

首先，定义一个字典列表，每个字典包含子字符串与对应映射值的键值对。例如：

mapping = [
    {'sub_str': 'apple', 'map_value': 'fruit'},
    {'sub_str': 'carrot', 'map_value': 'vegetable'}
]

然后，创建一个pandas的DataFrame，并包含需要映射的列。例如：

import pandas as pd

data = {'text': ['I love apple', 'I eat carrot']}
df = pd.DataFrame(data)

接下来，使用map()函数将字典列表中的子字符串映射到pandas列中的值。例如：

df['category'] = df['text'].map({item['sub_str']: item['map_value'] for item in mapping})

最后，可以查看映射结果：

print(df)

输出：

             text   category
0   I love apple      fruit
1     I eat carrot  vegetable

这种方法适用于通过匹配字典列表中的子字符串来映射pandas列的场景，可以方便地实现数据的映射和转换。

相关·内容

不再纠结，一文详解pandas中的map、apply、applymap、groupby、agg...

30 分钟轻松搞定正则表达式基础

提起正则表达式，可能大家的第一印象是：既强大好用但也晦涩难懂。正则表达式在文本处理中相当重要，各大编程语言中均有支持（跟 Linux 三剑客结合更是神兵利器）。正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。（来自百度百科）个人理解如下：某个大佬为了从字符串中匹配或找出符合特定规律（如手机号、身份证号）的子字符串，先定义了一些通用符号来表示字符串中各个类型的元素（如数字用 \d 表示），再将它们组合起来得到了一个模板（如：\d\d模板就是指代两个数字），拿这个模板去字符串中比对，找出符合该模板的子字符串。由几个例子去进一步理解，比如现在有一个字符串为： 1.test是一个正则表达式，它的匹配情况：I am a tester, and My job is to test some software. 它既可以匹配tester中的test，又可以匹配第二个test。正则表达式中的test就代表test这个单词本身。 2.\btest\b是一个正则表达式，它的匹配情况：I am a tester, and My job is to test some software. 它只能匹配第二个test。因为\b具有特殊意义，指代的是单词的开头或结尾。故tester中的test就不符合该模式。 3.test\w*是一个正则表达式，它的匹配情况：I am a tester, and My job is to test some software. 它匹配出了tester，也匹配出了第二个test。其中\w的意思是匹配字母数字下划线，表示的是数量，指有0个或多个\w。所以这个正则表达是的意思就是匹配开头为test，后续跟着0个及以上字母数字下划线的子字符串 4.test\w+是一个正则表达式，它的匹配情况：I am a tester, and My job is to test some software. 它只匹配了tester。因为+与不同，+的意思是1个或多个，所以该正则表达式匹配的是开头为test，后续跟着1个及以上字母数字下划线的字符串。通过上述几个例子，应该可以看出正则表达式的工作方式，正则表达式由一般字符和元字符组成，一般字符就是例子中的‘test’，其指代的意思就是字符本身，t匹配的就是字母t；元字符就是例子中有特殊含义的字符，如\w, \b, *, +等。后续介绍一些基础的元字符。元字符有很多，不同元字符有不同的作用，大致可以分为如下几类。有些元字符专门用来指代字符串中的元素类型，常用的如下：

Panda处理文本和时序数据？首选向量化

Pandas作为Python数据分析的首选框架，不仅功能强大接口丰富，而且执行效率也相比原生Python要快的多，这是得益于Pandas底层由C实现，同时其向量化执行方式也非常利于并行计算。更重要的是，这种向量化操作不仅适用于数值计算，对于文本和时间格式也有着良好的支持，而这就不得不从Pandas的属性接口谈起。

Panda处理文本和时序数据？首选向量化

这个Pandas函数可以自动爬取Web图表

Pandas作为数据科学领域鳌头独占的利器，有着丰富多样的函数，能实现各种意想不到的功能。

pandas transform 数据转换的 4 个常用技巧！

本次给大家介绍一个功能超强的数据处理函数transform，相信很多朋友也用过，这里再次进行详细分享下。

Python：变量与数据类型

在 Python 中变量命名规定，必须是大小写英文，数字和下划线(_)的组合，并且不能用数字开头。

Pandas全景透视：解锁数据科学的黄金钥匙

当许多人开始踏足数据分析领域时，他们常常会对选择何种工具感到迷茫。在这个充满各种选项的时代，为什么会有这么多人选择 Pandas 作为他们的数据分析工具呢？这个问题似乎简单，但背后涉及了许多关键因素。在探究这个问题之前，让我们先理解一下 Pandas 的背景和特点。

Python 部分系统类的常用方法整理

下面是常用的几个系统类的常用方法整理: list: 列表[1, 2,...] set: 集合,无重复元素{1, 2,...} str: 字符串 dict: 字典{a:'a', b:'b',...} TextIOWrapper: 文件对象 append(x) 将x添加到序列的末尾 extend(t) 将t的内容添加到列表末尾,t可以为列表 insert(i, x) 将x插入到列表i处 count(x) 统计x在列表中出现的次数 index(x, [start, end]) 返回x在列表中第一次出现的下标(指

Python3快速入门（三）——Pyth

Python3 中有六种标准数据类型： A、Number（数字） B、String（字符串） C、List（列表） D、Tuple（元组） E、Set（集合） F、Dictionary（字典） Python3 的六种标准数据类型中，Number（数字）、String（字符串）、Tuple（元组）是不可变的，List（列表）、Dictionary（字典）、Set（集合）是可变的。

实操 | 内存占用减少高达90%，还不用升级硬件？没错，这篇文章教你妙用Pandas轻松处理大规模数据

编译 | AI科技大本营（rgznai100）参与 | 周翔注：Pandas(Python Data Analysis Library) 是基于 NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。此外，Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。相比较于 Numpy，Pandas 使用一个二维的数据结构 DataFrame 来表示表格式的数据，可以存储混合的数据结构，同时使用 NaN 来表示缺失的数据，而不用像 Numpy 一样要手工处理

特殊变量 (SQL)

SQL直接支持许多对象脚本特殊变量。这些变量包含系统提供的值。只要可以在SQL中指定文字值，就可以使用它们。

盘点66个Pandas函数，轻松搞定“数据清洗”！

之前黄同学曾经总结过一些Pandas函数，主要是针对字符串进行一系列的操作。在此基础上我又扩展了几倍，全文较长，建议先收藏。

Ansible 如何使用 Filter 插件转换数据

「傍晚时分，你坐在屋檐下，看着天慢慢地黑下去，心里寂寞而凄凉，感到自己的生命被剥夺了。当时我是个年轻人，但我害怕这样生活下去，衰老下去。在我看来，这是比死亡更可怕的事。--------王小波」

30 分钟轻松搞定正则表达式基础

提起正则表达式，可能大家的第一印象是：既强大好用但也晦涩难懂。正则表达式在文本处理中相当重要，各大编程语言中均有支持（跟 Linux 三剑客结合更是神兵利器）。

正则表达式详解

Pandas

Pandas 是 Python 的核心数据分析支持库，提供了快速、灵活、明确的数据结构，旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具，其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。经过多年不懈的努力，Pandas 离这个目标已经越来越近了。

[数据结构拾遗]子字符串匹配常用算法总结

本专栏旨在快速了解常见的数据结构和算法。在需要使用到相应算法时，能够帮助你回忆出常用的实现方案并且知晓其优缺点和适用环境。

Python String 方法详解三：字符串的联合与分割

返回指定长度的字符串，字符串内容居左（右）如果长度小于字符串长度，则返回原始字符串，默认填充为 ASCII 空格，可指定填充的字符串。

30 分钟轻松搞定正则表达式基础

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

通过匹配字典列表中的子字符串来映射pandas列

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐