开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

我需要一个用于pandas dataframe的函数，它可以识别相等的字符串，然后赋值给新列

您可以使用np.where()函数来实现这个功能。np.where()函数可以根据条件选择性地赋值。

首先，您需要导入numpy和pandas库：

import numpy as np
import pandas as pd

然后，您可以定义一个函数，该函数接受三个参数：要比较的字符串列、要匹配的字符串和要赋值的新列名。函数的实现如下：

def assign_value(df, column, match_string, new_column):
    df[new_column] = np.where(df[column] == match_string, match_string, '')

接下来，您可以使用该函数来处理pandas的DataFrame。假设您有一个名为df的DataFrame，其中包含一个名为column_name的字符串列，您想要将匹配字符串match_string赋值给一个名为new_column_name的新列。您可以调用函数如下：

assign_value(df, 'column_name', 'match_string', 'new_column_name')

这将在df中创建一个新列new_column_name，并将匹配的字符串赋值给该列，不匹配的字符串则为空字符串。

这是一个示例代码，您可以根据自己的实际需求进行调整和扩展。希望对您有帮助！

相关搜索:如何在由特定列中字符串值确定的pandas数据帧中选择行的范围，“每次这个字符串值出现时，我都需要一个新的切片”我有一个DataFrame，需要在列之间执行计算。我的函数do_something可以矢量化吗？linux grep pid linux qt静态编译工程 linux tail 指定行 Linux 内存满 cpu空 linux 获取文件名循环 linux 查看目录详细信息 libxml linux c linux搜索geteuid

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Pandas用了一年，这3个函数是我最的最爱……

作为一名数据分析师，也是Pandas重度依赖者，虽然其提供了大量便利的接口，但其中的这3个却使用频率更高！

03

解决pandas.core.frame.DataFrame格式数据与numpy.ndarray格式数据不一致导致无法运算问题

在数据分析与机器学习中，经常会遇到处理数据的问题。而使用Python进行数据处理和分析时，pandas库和numpy库是常用的工具。其中，pandas库提供了DataFrame数据结构，numpy库提供了ndarray数据结构。然而，有时候我们会遇到DataFrame格式数据与ndarray格式数据不一致导致无法进行运算的问题。本文将介绍一种解决这个问题的方法。

02

Python数据分析-pandas库入门

pandas 提供了快速便捷处理结构化数据的大量数据结构和函数。自从2010年出现以来，它助使 Python 成为强大而高效的数据分析环境。pandas使用最多的数据结构对象是 DataFrame，它是一个面向列（column-oriented）的二维表结构，另一个是 Series，一个一维的标签化数组对象。

02

嘀~正则表达式快速上手指南（下篇）

上面的代码中用 for 循环去遍历 contents 这样我们就可以一个一个处理每封邮件。我们创建一个字典， emails_dict,这将保存每个电子邮件的所有细节，如发件人的地址和姓名。事实上，这些是我们要寻找的第一项信息。

01

Pandas入门2

对于DataFrame，对齐会同时发生在行和列上，两个DataFrame对象相加后，其索引和列会取并集，缺省值用NaN。

02

Pandas 25 式

原文的数据集是 bit.ly 短网址的，我这里在读取时出问题，不稳定，就帮大家下载下来，统一放到了 data 目录里。

00

数据分析篇 | PyCon 大咖亲传 pandas 25 式，长文建议收藏

Kevin Markham，数据科学讲师，2002 年，毕业于范德堡大学，计算机工程学士，2014 年，创建了 Data School，在线教授 Python 数据科学课程，他的课程主要包括 Pandas、Scikit-learn、Kaggle 竞赛数据科学、机器学习、自然语言处理等内容，迄今为止，浏览量在油管上已经超过 500 万次。

02

【精心解读】用pandas处理大数据——节省90%内存消耗的小贴士

本文我们讨论 pandas 的内存使用，展示怎样简单地为数据列选择合适的数据类型，就能够减少 dataframe 近 90% 的内存占用。

05

Pandas图鉴(二)：Series 和 Index

Pandas[1]是用Python分析数据的工业标准。只需敲几下键盘，就可以加载、过滤、重组和可视化数千兆字节的异质信息。它建立在NumPy库的基础上，借用了它的许多概念和语法约定，所以如果你对NumPy很熟悉，你会发现Pandas是一个相当熟悉的工具。即使你从未听说过NumPy，Pandas也可以让你在几乎没有编程背景的情况下轻松拿捏数据分析问题。

02

Pandas最详细教程来了！

导读：在Python中，进行数据分析的一个主要工具就是Pandas。Pandas是Wes McKinney在大型对冲基金AQR公司工作时开发的，后来该工具开源了，主要由社区进行维护和更新。

01

整理了 25 个 Pandas 实用技巧，拿走不谢！

来源：www.cnblogs.com/jclian91/p/12305471.html

01

Python数据分析笔记——Numpy、Pandas库

Python数据分析——Numpy、Pandas库总第48篇 ▼ 利用Python进行数据分析中有两个重要的库是Numpy和Pandas，本章将围绕这两个库进行展开介绍。 Numpy库 Numpy

08

Python科学计算之Pandas

在我看来，对于Numpy以及Matplotlib，Pandas可以帮助创建一个非常牢固的用于数据挖掘与分析的基础。而Scipy（会在接下来的帖子中提及）当然是另一个主要的也十分出色的科学计算库，但是我认为前三者才是真正的Python科学计算的支柱。

00

Pandas图鉴(三)：DataFrames

Polars[2]是Pandas最近的转世（用Rust编写，因此速度更快，它不再使用NumPy的引擎，但语法却非常相似，所以学习 Pandas 后对学习 Polars 帮助非常大。

02

《利用Python进行数据分析·第2版》第7章数据清洗和准备7.1 处理缺失数据7.2 数据转换7.3 字符串操作7.4 总结

在数据分析和建模的过程中，相当多的时间要用在数据准备上：加载、清理、转换以及重塑。这些工作会占到分析师时间的80%或更多。有时，存储在文件和数据库中的数据的格式不适合某个特定的任务。许多研究者都选择使用通用编程语言（如Python、Perl、R或Java）或UNIX文本处理工具（如sed或awk）对数据格式进行专门处理。幸运的是，pandas和内置的Python标准库提供了一组高级的、灵活的、快速的工具，可以让你轻松地将数据规变为想要的格式。如果你发现了一种本书或pandas库中没有的数据操作方式，请尽管

09

Python 办公小助手：修改 PDF 中的表格

日常工作中，我们或多或少都会接触到 Excel 表格、Word 文档和 PDF 文件。偶尔来个处理文件的任务，几个快捷键操作一下——搞定！但是，偏偏有些烦人的工作，操作繁琐且数据复杂，更要命的是耗时间，吭哧吭哧一下午却难出几个成果。

02

pandas教程（一）Series与DataFrame

预备知识：NumPy数组是一个多维数组对象，称为ndarray。其由两部分组成：实际的数据、描述这些数据的元数据

02

整理了25个Pandas实用技巧（下）

假设你将一些数据储存在Excel或者Google Sheet中，你又想要尽快地将他们读取至DataFrame中。

01

整理了25个Pandas实用技巧

假设你将一些数据储存在Excel或者Google Sheet中，你又想要尽快地将他们读取至DataFrame中。

04

python数据科学系列：pandas入门详细教程

前2篇分别系统性介绍了numpy和matplotlib的入门基本知识，今天本文自然是要对pandas进行入门详细介绍，通过本文你将系统性了解pandas为何会有数据分析界"瑞士军刀"的盛誉。

02

数据处理 | 在学这几个pandas函数，继续加快你数据处理的速度

上次我们介绍了几个pandas函数，如nlargest()、pct_change()和explode()，《学会这些好用的pandas函数，让你的数据处理更快人一步》让大家可以更快的求取前N组数据、计算数据之间变化率以及将列表元素数据展开为一列等等。

03

Python可视化数据分析05、Pandas数据分析

Series是一种类似于一维数组的对象，它由一组数据以及一组与之相关的数据标签（索引）组成，创建Series对象的语法如下：

02

Python数据分析实战基础 | 初识Pandas

这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像自己什么都会了一点，然而实际操作起来既不知从何操起，又漏洞百出。

02

Python数据分析实战基础 | 初识Pandas

这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像自己什么都会了一点，然而实际操作起来既不知从何操起，又漏洞百出。

04

Python数据分析实战基础 | 初识Pandas

这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像自己什么都会了一点，然而实际操作起来既不知从何操起，又漏洞百出。

03

Python数据分析实战基础 | 初识Pandas

这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像自己什么都会了一点，然而实际操作起来既不知从何操起，又漏洞百出。

01

一文带你快速入门Python | 初识Pandas

这是Python数据分析实战基础的第一篇内容，主要是和Pandas来个简单的邂逅。已经熟练掌握Pandas的同学，可以加快手速滑动浏览或者直接略过本文。

00

Python数据分析实战基础 | 初识Pandas

这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像自己什么都会了一点，然而实际操作起来既不知从何操起，又漏洞百出。

03

Pandas | 如何新增数据列？

在数据分析时，原始数据往往不能满足我们的需求，经常需要按照一定条件创建新的数据列或者修改原有数据列，然后进行后续分析。

04

这些pandas技巧你还不会吗 | Pandas实用手册（PART II）

这一系列一共三部分，里面的一些技巧可能暂时用不上，但是相信总有一天你会接触到，建议收藏

02

数据科学 IPython 笔记本 7.15 高性能 Pandas

我们在前面的章节中已经看到，PyData 技术栈的力量，建立在 NumPy 和 Pandas 通过直观语法，将基本操作推送到 C 的能力的基础上：例如 NumPy 中的向量化/广播操作，以及 Pandas 的分组类型操作。虽然这些抽象对于许多常见用例是高效且有效的，但它们通常依赖于临时中间对象的创建，这可能产生计算时间和内存使用的开销。

01

解决问题‘Series‘ object has no attribute ‘sort‘

当我们在使用Pandas库处理数据时，有时候可能会遇到一个报错：'Series' object has no attribute 'sort'。这个报错的原因是因为Pandas库在较新版本中将'sort'方法改名为'sort_values'方法。

01

Python数据分析模块 | pandas做数据分析(二):常用预处理操作

在数据分析和机器学习的一些任务里面,对于数据集的某些列或者行丢弃，以及数据集之间的合并操作是非常常见的. 1、合并操作 pandas.merge pandas.merge(left, right, how=’inner’, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=(‘_x’, ‘_y’), copy=True, indicator=False) 作用:通过执

06

Pandas中的数据转换[细节]

Pandas中的axis参数=0时，永远表示的是处理方向而不是聚合方向，当axis='index'或=0时，对列迭代对行聚合，行即为跨列，axis=1同理 💥

01

数据城堡参赛代码实战篇（三）---我们来探究一个深奥的问题！

每天12点是小编最激动的时候，因为自己写的帖子又可以与大家见面啦，昨天把帖子传到某个大神组织的数据挖掘交流群时，某挖掘机朋友问了小编一个深刻的问题，题目看似很简单，但是以小编大脑里的知识系统来说，根本

05

用Python执行SQL、Excel常见任务？10个方法全搞定！

数据从业者有许多工具可用于分割数据。有些人使用 Excel，有些人使用SQL，有些人使用Python。对于某些任务，使用 Python 的优点是显而易见的。以更快的速度处理更大的数据集。使用基于 Python 构建的开源机器学习库。你可以轻松导入和导出不同格式的数据。

02

通宵翻译Pandas官方文档，写了这份Excel万字肝货操作！

这篇万字长文，是黄同学辛苦为大家辛苦翻译排版。希望大家一定从头到尾学习，否则，可能会找不到操作的数据源。

02

Python数学建模算法与应用 - 常用Python命令及程序注解

本文是根据Python数学建模算法与应用这本书中的例程所作的注解，相信书中不懂的地方，你都可以在这里找打答案，建议配合书阅读本文

03

Pandas的apply方法的应用练习

请创建一个新的列'new_column'，其值为'column1'中每个元素的两倍，当原来的元素大于10的时候，将新列里面的值赋0

01

Python 算法交易秘籍（一）

Python 是一种非常流行的语言，用于构建和执行算法交易策略。如果您想了解如何使用 Python 构建算法交易的坚实基础，本书可以帮助您。

05

Python数据分析的数据导入和导出

数据分析的数据的导入和导出是数据分析流程中至关重要的两个环节，它们直接影响到数据分析的准确性和效率。在数据导入阶段，首先要确保数据的来源可靠、格式统一，并且能够满足分析需求。这通常涉及到数据清洗和预处理的工作，比如去除重复数据、处理缺失值、转换数据类型等，以确保数据的完整性和一致性。

01

PySpark SQL——SQL和pd.DataFrame的结合体

昨日推文PySpark环境搭建和简介，今天开始介绍PySpark中的第一个重要组件SQL/DataFrame，实际上从名字便可看出这是关系型数据库SQL和pandas.DataFrame的结合体，功能也几乎恰是这样，所以如果具有良好的SQL基本功和熟练的pandas运用技巧，学习PySpark SQL会感到非常熟悉和舒适。

02

Pandas之read_csv()读取文件跳过报错行的解决

pandas.read_csv(filePath) 方法来读取csv文件时，可能会出现这种错误：

02

Python自动化办公之Word批量转成自定义格式的Excel

python实现word转成自定义格式的excel文档（解决思路和代码）支持按照文件夹去批量处理，也可以单独一个文件进行处理，并且可以自定义标识符。

04

04.字段抽取/拆分&记录抽取1.字段抽取2.字段拆分3.记录抽取

1.字段抽取根据已知列的开始与结束位置，抽取出新的列字段截取函数slice(start, stop) slice()函数只能处理字符型数据 start从0开始，取值范围前闭后开。 from pandas import read_csv df = read_csv( '/users/bakufu/desktop/4.6/data.csv' ) Out[65]: tel 0 18922254812 1 13522255003 2 134222599

02

数据导入与预处理-课程总结-04~06章

数据经过采集后通常会被存储到Word、Excel、JSON等文件或数据库中，从而为后期的预处理工作做好数据储备。数据获取是数据预处理的第一步操作，主要是从不同的渠道中读取数据。Pandas支持CSV、TXT、Excel、JSON这几种格式文件、HTML表格的读取操作，另外Python可借助第三方库实现Word与PDF文件的读取操作。本章主要为大家介绍如何从多个渠道中获取数据，为预处理做好数据准备。

01

整理了10个经典的Pandas数据查询案例

Pandas的query函数为我们提供了一种编写查询过滤条件更简单的方法，特别是在的查询条件很多的时候，在本文中整理了10个示例，掌握着10个实例你就可以轻松的使用query函数来解决任何查询的问题。

02

整理了10个经典的Pandas数据查询案例

Pandas的query函数为我们提供了一种编写查询过滤条件更简单的方法，特别是在的查询条件很多的时候，在本文中整理了10个示例，掌握着10个实例你就可以轻松的使用query函数来解决任何查询的问题。

02

如何用 Python 执行常见的 Excel 和 SQL 任务

作者：ROGER HUANG 本文翻译自：http://code-love.com/2017/04/30/excel-sql-python/ 来源：https://www.jianshu.com/p/51bb7726231b 本教程的代码和数据可在 Github 资源库中找到。有关如何使用 Github 的更多信息，请参阅本指南。数据从业者有许多工具可用于分割数据。有些人使用 Excel，有些人使用SQL，有些人使用Python。对于某些任务，使用 Python 的优点是显而易见的。以更快的速度处理更大

06

Pandas图鉴(四)：MultiIndex

Polars[2]是Pandas最近的转世（用Rust编写，因此速度更快，它不再使用NumPy的引擎，但语法却非常相似，所以学习 Pandas 后对学习 Polars 帮助非常大。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭