首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何在pandas中创建新列,并根据第二列是否包含各种字符串列表中的字符串来设置其值

在pandas中创建新列,并根据第二列是否包含各种字符串列表中的字符串来设置其值,可以使用apply函数结合lambda表达式来实现。

首先,我们需要导入pandas库:

代码语言:txt
复制
import pandas as pd

然后,我们可以创建一个DataFrame对象,其中包含两列数据,假设第一列为"column1",第二列为"column2":

代码语言:txt
复制
data = {'column1': ['apple', 'banana', 'orange', 'grape'],
        'column2': ['I like apple', 'I hate banana', 'I love orange', 'I dislike grape']}
df = pd.DataFrame(data)

接下来,我们可以定义一个字符串列表,例如:

代码语言:txt
复制
string_list = ['like', 'love']

然后,我们可以使用apply函数和lambda表达式来创建新列,并根据第二列是否包含字符串列表中的字符串来设置其值:

代码语言:txt
复制
df['new_column'] = df['column2'].apply(lambda x: any(word in x for word in string_list))

在上述代码中,lambda表达式会遍历字符串列表中的每个字符串,检查该字符串是否在第二列的每个元素中出现,如果出现则返回True,否则返回False。apply函数会将lambda表达式应用到第二列的每个元素上,并将结果赋值给新列"new_column"。

最后,我们可以打印DataFrame对象来查看结果:

代码语言:txt
复制
print(df)

输出结果如下:

代码语言:txt
复制
  column1          column2  new_column
0   apple    I like apple         True
1  banana   I hate banana        False
2  orange  I love orange         True
3   grape  I dislike grape       False

这样,我们就成功地在pandas中创建了新列,并根据第二列是否包含各种字符串列表中的字符串来设置其值。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

如何用 Python 执行常见 Excel 和 SQL 任务

有关数据结构,列表和词典,如何在 Python 运行更多信息,本教程将有所帮助。...现在,可以对我们以前不能做的人均 GDP 进行各种计算,包括通过不同过滤确定百分位数值。 选择/过滤数据 任何数据分析师基本需求是将大型数据集分割成有价值结果。...使用相同逻辑,我们可以计算各种 -- 完整列表位于左侧菜单栏下计算/描述性统计部分 Pandas 文档。...有关数据可视化选项综合教程 - 我最喜欢是这个 Github readme document (全部在文本),它解释了如何在 Seaborn 构建概率分布和各种各样图。...现在我们可以看到,人均 GDP 根据世界不同地区而不同。我们有一个干净包含我们想要数据表。

10.7K60

用Python执行SQL、Excel常见任务?10个方法全搞定!

有关数据结构,列表和词典,如何在 Python 运行更多信息,本篇将有所帮助。...现在,可以对我们以前不能做的人均 GDP 进行各种计算,包括通过不同过滤确定百分位数值。 07 选择/过滤数据 任何数据分析师基本需求是将大型数据集分割成有价值结果。...使用相同逻辑,我们可以计算各种 — 完整列表位于左侧菜单栏下计算/描述性统计部分 Pandas 文档。...有关数据可视化选项综合教程 – 我最喜欢是这个 Github readme document (全部在文本),它解释了如何在 Seaborn 构建概率分布和各种各样图。...现在我们可以看到,人均 GDP 根据世界不同地区而不同。我们有一个干净包含我们想要数据表。

8.2K20

Pandas 秘籍:1~5

操作步骤 创建最简单方法是为分配标量值。 将名称作为字符串放入索引运算符。 让我们在电影数据集中创建has_seen以指示我们是否看过电影。 我们将为每个分配零。...该秘籍既分配了标量值(步骤 1 所示),又分配了序列(步骤 2 所示),以创建。 步骤 2 将四个不同序列使用加法运算符相加。 步骤 3 使用方法链查找和填充缺失。...更多 除了insert方法末尾,还可以将插入数据帧特定位置。insert方法将整数位置作为第一个参数,将名称作为第二个参数,并将作为第三个参数。...最重要(例如电影标题)位于第一位。 步骤 4 连接所有列名称列表验证此列表是否包含与原始列名称相同。 Python 集是无序,并且相等语句检查一个集每个成员是否是另一个集成员。...手动排序此秘籍容易受到人为错误影响,因为很容易错误地忘记列表。 步骤 5 通过将顺序作为列表传递给索引运算符完成重新排序。 现在,这个顺序比原来要明智得多。

37.2K10

Python数学建模算法与应用 - 常用Python命令及程序注解

它接受一个可迭代对象(列表、元组、字符串等)作为参数,返回一个生成器。 生成器会依次生成由索引和对应元素组成元组。...它根据函数 fn 指定条件将列表 L 分割为两个子列表。函数 fn 是一个 lambda 函数,它检查列表 L 元素首字符是否等于 'b'。...filter 函数基本语法如下: filter(function, iterable) function 是一个函数,它将被应用于可迭代对象每个元素,根据返回决定是否保留该元素。...iterable 是一个可迭代对象,列表、元组等。 filter 函数工作原理是将函数 function 应用于 iterable 每个元素,根据函数返回布尔决定是否保留该元素。...map 函数用于对可迭代对象每个元素应用指定函数,返回一个包含应用结果可迭代对象。 返回不同: filter 函数返回一个可迭代对象,其中只包含满足条件元素。

1.3K30

直观地解释和可视化每个复杂DataFrame操作

操作数据帧可能很快会成为一项复杂任务,因此在Pandas八种技术均提供了说明,可视化,代码和技巧记住如何做。 ?...每种方法都将包括说明,可视化,代码以及记住它技巧。 Pivot 透视表将创建一个“透视表”,该透视表将数据现有投影为元素,包括索引,。...我们选择一个ID,一个维度和一个包含/包含将转换为两:一用于变量(名称),另一用于(变量包含数字)。 ?...要记住:从外观上看,堆栈采用表二维性并将堆栈为多级索引。 Unstack 取消堆叠将获取多索引DataFrame进行堆叠,将指定级别的索引转换为具有相应DataFrame。...作为另一个示例,当级别设置为0(第一个索引级别)时,其中将成为,而随后索引级别(第二个索引级别)将成为转换后DataFrame索引。 ?

13.3K20

精通 Pandas 探索性分析:1~4 全

点表示法 还有另一种方法可以根据从数据帧中选择数据子集创建序列。 此方法称为点表示法。.../img/3cee634e-99f8-4ec7-8fce-0ebb53bcb71e.png)] 您在前面的屏幕快照中所见,我们按State和Metro过滤了使用过滤器创建了一个数据帧...我们将介绍axis参数,逐步介绍可以将axis关键字设置各种。 我们将演示如何将axis设置为行或改变方法行为。 我们还将展示一些使用axis关键字代码示例。...重命名 Pandas 数据帧 在本节,我们将学习在 Pandas 重命名列标签各种方法。 我们将学习如何在读取数据后和读取数据时重命名列,并且还将看到如何重命名所有或特定。...通过将how参数传递为outer完成完整外部合并: 现在,即使对于没有标记为NaN,它也包含所有行,而不管它们是否存在于一个或另一个数据集中,或存在于两个数据集中。

28K10

Python数据分析-pandas库入门

导入 pandas 模块,和常用子模块 Series 和 DataFrame import pands as pd from pandas import Series,DataFrame 通过传递列表创建...Series 单个或一组,代码示例: obj2[['a', 'b', 'c']] obj2['a']=2 obj2[['a', 'b', 'c']] [‘a’,’b’,’c]是索引列表,即使它包含字符串而不是整数...,它含有一组有序,每可以是不同类型(数值、字符串、布尔等)。...作为 del 例子,这里先添加一个布尔,state 是否为 ‘Ohio’,代码示例: frame2['eastern'] = frame2.state=='Ohio' frame2 DataFrame...每个索引都有一些方法和属性,它们可用于设置逻辑并回答有关该索引所包含数据常见问题。

3.7K20

单列文本拆分为多,Python可以自动化

在这里,我特意将“出生日期”类型强制为字符串,以便展示切片方法。实际上,pandas应该自动检测此列可能是datetime,并为分配datetime对象,这使得处理日期数据更加容易。...对于了解Excel并且倾向于使用公式解决此问题的人,第一反应可能是:好,我将创建一个可能包含FIND函数和LEFT函数或MID函数等公式,然后向下拖动以将其应用于所有单元格。...我们可以使用Python字符串切片获取年、月和日。字符串本质上类似于元组,我们可以对字符串使用相同列表切片技术。看看下面的例子。...让我们在“姓名”尝试一下,以获得名字和姓氏。 图7 拆分是成功,但是当我们检查数据类型时,它似乎是一个pandas系列,每行是包含两个单词列表。...我们想要是将文本分成两pandas系列),需要用到split()方法一个可选参数:expand。当将其设置为True时,可以将拆分项目返回到不同

6.9K10

python数据科学系列:pandas入门详细教程

切片形式访问时按行进行查询,又区分数字切片和标签切片两种情况:当输入数字索引切片时,类似于普通列表切片;当输入标签切片时,执行范围查询(即无需切片首末存在于标签),包含两端标签结果,无匹配行时返回为空...isin/notin,条件范围查询,即根据特定是否存在于指定列表返回相应结果 where,仍然是执行条件查询,但会返回全部结果,只是将不满足匹配条件结果赋值为NaN或其他指定,可用于筛选或屏蔽...需注意对空界定:即None或numpy.nan才算空,而空字符串、空列表等则不属于空;类似地,notna和notnull则用于判断是否非空 填充空,fillna,按一定策略对空进行填充,如常数填充...时间类型向量化操作,字符串一样,在pandas另一个得到"优待"数据类型是时间类型,正如字符串列可用str属性调用字符串接口一样,时间类型可用dt属性调用相应接口,这在处理时间类型时会十分有效。...;sort_values是按排序,如果是dataframe对象,也可通过axis参数设置排序方向是行还是,同时根据by参数传入指定行或者,可传入多行或多分别设置升序降序参数,非常灵活。

13.8K20

数据分析篇 | PyCon 大咖亲传 pandas 25 式,长文建议收藏

操控缺失字符串分割为多 把 Series 里列表转换为 DataFrame 用多个函数聚合 用一个 DataFrame 合并聚合输出结果 选择行与 重塑多重索引 Series 创建透视表...还可以使用 exclude 关键字排除指定数据类型。 ? 7. 把字符串转换为数值 再创建一个 DataFrame 示例。 ?...用 dropna() 删除所有缺失。 ? 只想删除缺失高于 10% 缺失,可以设置 dropna() 里阈值,即 threshold. ? 16....把 Series 里列表转换为 DataFrame 创建一个 DataFrame 示例。 ? 这里包含了两第二包含是 Python 整数列表。...年龄列有 1 位小数,票价列有 4 位小数,如何将这两显示小数位数标准化? 用以下代码让这两只显示 2 位小数。 ? 第一个参数是要设置选项名称,第二个参数是 Python 字符串格式。

7.1K20

30 个小例子帮你快速掌握Pandas

inplace参数设置为True以保存更改。我们删除了4,因此列数从14减少到10。 2.读取时选择特定 我们只打算读取csv文件某些。读取时,列表将传递给usecols参数。...第一个参数是位置索引,第二个参数是名称,第三个参数是。 19.where函数 它用于根据条件替换行或。默认替换是NaN,但我们也可以指定要替换。...method参数指定如何处理具有相同行。first表示根据它们在数组(即顺序对进行排名。 21.唯一数量 使用分类变量时,它很方便。我们可能需要检查唯一类别的数量。...Geography内存消耗减少了近8倍。 24.替换 替换函数可用于替换DataFrame。 ? 第一个参数是要替换第二个参数是。 我们可以使用字典进行多次替换。 ?...endswith函数根据字符串末尾字符进行相同过滤。 Pandas可以对字符串进行很多操作。

10.6K10

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

Pandas ,索引可以设置为一个(或多个)唯一,这就像在工作表中有一用作行标识符一样。与大多数电子表格不同,这些索引实际上可用于引用行。...读取外部数据 Excel 和 pandas 都可以从各种来源以各种格式导入数据。 CSV 让我们从 Pandas 测试中加载显示提示数据集,这是一个 CSV 文件。...pandas 通过在 DataFrame 中指定单个系列提供矢量化操作。可以以相同方式分配。DataFrame.drop() 方法从 DataFrame 删除一。...If/then逻辑 假设我们想要根据 total_bill 是小于还是大于 10 美元,创建一个具有低和高。 在Excel电子表格,可以使用条件公式进行逻辑比较。...按排序 Excel电子表格排序,是通过排序对话框完成pandas 有一个 DataFrame.sort_values() 方法,它需要一个列表排序。

19.5K20

【精心解读】用pandas处理大数据——节省90%内存消耗小贴士

每种数据类型在pandas.core.internals模块中都有一个特定类。pandas使用ObjectBlock类表示包含字符串数据块,用FloatBlock类表示包含浮点型数据块。...对于包含数值型数据(比如整型和浮点型)数据块,pandas会合并这些,并把它们存储为一个Numpy数组(ndarray)。Numpy数组是在C数组基础上创建在内存是连续存储。...Pandas用一个字典构建这些整型数据到原数据映射关系。当一包含有限种时,这种设计是很不错。...我们先选择其中一个object,开看看将其转换成类别类型会发生什么。这里我们选用第二:day_of_week。 我们从上表可以看到,它只包含了7个唯一。...下面我们写一个循环,对每一个object进行迭代,检查唯一是否少于50%,如果是,则转换成类别类型。

8.6K50

Pandas 25 式

操控缺失字符串分割为多 把 Series 里列表转换为 DataFrame 用多个函数聚合 用一个 DataFrame 合并聚合输出结果 选择行与 重塑多重索引 Series 创建透视表...还可以使用 exclude 关键字排除指定数据类型。 ? 7. 把字符串转换为数值 再创建一个 DataFrame 示例。 ?...用 dropna() 删除所有缺失。 ? 只想删除缺失高于 10% 缺失,可以设置 dropna() 里阈值,即 threshold. ? 16....把 Series 里列表转换为 DataFrame 创建一个 DataFrame 示例。 ? 这里包含了两第二包含是 Python 整数列表。...年龄列有 1 位小数,票价列有 4 位小数,如何将这两显示小数位数标准化? 用以下代码让这两只显示 2 位小数。 ? 第一个参数是要设置选项名称,第二个参数是 Python 字符串格式。

8.4K00

Python 算法交易秘籍(一)

本章包含各种食谱,演示了如何使用 Python 标准库和pandas进行算法交易,pandas是一个 Python 数据分析库。...在步骤 5,通过向构造函数传递columns参数以特定顺序创建一个DataFrame,该参数是一个字符串列表。...如果不传递,默认为False,意味着将创建一个DataFrame而不是修改df。 重新排列:在步骤 2 ,你使用reindex()方法从df创建一个DataFrame,重新排列。...类似地,在 步骤 4 ,您通过按照 df open 降序排列创建一个 DataFrame 对象。... unique() 方法返回一个由经纪人支持唯一交易所组成 numpy.ndarray 对象。 查询分段列表 一个分段实质上是根据类型对工具进行分类。

65450

Pandas 秘籍:6~11

您可以通过将columns属性设置为等于列表简单地为整个数据帧设置。.../img/00215.jpeg)] 让我们创建一个包含一些数据列表使用.loc索引器设置一个等于该数据行标签: >>> new_data_list = ['Aria', 1] >>> names.loc...不管实际标签是多少,行始终将附加在最后。 即使使用列表分配也可以,但为清楚起见,最好使用字典,以便我们准确地知道与每个关联步骤 4 所示。...可以传递groupby任意数量自定义函数列表步骤 5 所示。这里,第一个函数使用日期时间索引round方法将每个四舍五入到最接近第二小时。 第二个函数检索年份。...在此步骤,我们使用rolling方法根据最近五年数据平均值计算每年。 例如,将 2011 年至 2015 年预算中位数进行分组取平均值。 结果是 2015 年

33.8K10

Pandas全景透视:解锁数据科学黄金钥匙

索引提供了对 Series 数据标签化访问方式。(Values): 是 Series 存储实际数据,可以是任何数据类型,整数、浮点数、字符串等。...了解完这些,接下来,让我们一起探索 Pandas 那些不可或缺常用函数,掌握数据分析关键技能。①.map() 函数用于根据传入字典或函数,对 Series 每个元素进行映射或转换。...具体来说,map()函数可以接受一个字典或一个函数作为参数,然后根据这个字典或函数对 Series 每个元素进行映射或转换,生成一个 Series,返回该 Series。...如果传入是一个字典,则 map() 函数将会使用字典中键对应替换 Series 元素。如果传入是一个函数,则 map() 函数将会使用该函数对 Series 每个元素进行转换。...尽管本文仅触及了Pandas强大功能表面,但广阔应用领域和深邃技术内涵仍待我们进一步挖掘和学习。

8610

python数据分析——数据分类汇总与统计

第一个阶段,pandas对象数据会根据你所提供一个或多个键被拆分(split)为多组。拆分操作是在对象特定轴上执行。...例如, DataFrame可以在其行(axis=0)或(axis=1)上进行分组。然后,将一个函数应用(apply)到各个分组产生一个。...关键技术:对于由DataFrame产生GroupBy对象,如果用一个(单个字符串)或一组(字符串数组)列名对进行索引,就能实现选取部分列进行聚合目的。...关键技术:如果传给apply函数能够接受其他参数或关键字,则可以将这些内容放在函数名后面一传入: 【例15】在apply函数设置禁止分组键。...: 行名称 margins : 总计行/ normalize:将所有除以总和进行归一化,为True时候显示百分比 dropna :是否刪除缺失 【例19】根据国籍和用手习惯对这段数据进行统计汇总

12810
领券