开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

根据pandas中的条件，将列名列表作为新列返回

在pandas中，可以使用条件来选择数据，并将选择的列名列表作为新列返回。具体步骤如下：

导入pandas库：首先需要导入pandas库，可以使用以下代码实现：

import pandas as pd

创建数据框：接下来，需要创建一个包含数据的数据框。可以使用以下代码创建一个示例数据框：

data = {'Name': ['John', 'Emma', 'Mike', 'Emily'],
        'Age': [25, 30, 35, 28],
        'Gender': ['Male', 'Female', 'Male', 'Female']}
df = pd.DataFrame(data)

使用条件选择数据：使用条件选择数据可以使用pandas的条件语句，例如，选择年龄大于30的数据可以使用以下代码：

condition = df['Age'] > 30
selected_data = df[condition]

将选择的列名列表作为新列返回：要将选择的列名列表作为新列返回，可以使用以下代码：

selected_columns = ['Name', 'Age']
new_df = df[selected_columns]

完整的代码示例如下：

import pandas as pd

data = {'Name': ['John', 'Emma', 'Mike', 'Emily'],
        'Age': [25, 30, 35, 28],
        'Gender': ['Male', 'Female', 'Male', 'Female']}
df = pd.DataFrame(data)

condition = df['Age'] > 30
selected_data = df[condition]

selected_columns = ['Name', 'Age']
new_df = df[selected_columns]

在上述代码中，根据条件选择了年龄大于30的数据，并将选择的列名列表['Name', 'Age']作为新列返回。

相关搜索:Cumsum作为现有Pandas数据中的新列 Databricks Koalas:使用for循环创建带条件的新列，并根据旧的列名动态命名新列 pandas:根据另一列表列中的条件返回列表列中的值 R根据2列中的条件创建新列使用pandas根据其他列中的条件创建新的ID列在Dataframe中添加新列，并根据条件将行值更新为其他列名在Pandas中根据条件返回公共列如何根据pandas中的其他列添加新列？如何根据列中的值更改条件的条件- Pandas 如何根据列名中的单词列表选择列

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

用过Excel，就会获取pandas数据框架中的值、行和列

返回索引列表，在我们的例子中，它只是整数0、1、2、3。...df.columns 提供列（标题）名称的列表。 df.shape 显示数据框架的维度，在本例中为4行5列。图3 使用pandas获取列有几种方法可以在pandas中获取列。...因为我们用引号将字符串（列名）括起来，所以这里也允许使用带空格的名称。图5 获取多列方括号表示法使获得多列变得容易。语法类似，但我们将字符串列表传递到方括号中。...图9 要获得第2行和第4行，以及其中的用户姓名、性别和年龄列，可以将行和列作为两个列表传递，如下图所示。图10 记住，df[['用户姓名'，'年龄'，'性别']]返回一个只有三列的新数据框架。...图11 试着获取第3行Harry Poter的国家的名字。图12 要获得第2行和第4行，以及其中的用户姓名、性别和年龄列，可以将行和列作为两个列表传递到参数“row”和“column”位置。

18.9K6 0

python数据分析笔记——数据加载与整理

2、当文件没有标题行时可以让pandas为其自动分配默认的列名。也可以自己定义列名。 3、将某一列作为索引，比如使用message列做索引。通过index_col参数指定’message’。...4、要将多个列做成一个层次化索引，只需传入由列编号或列名组成的列表即可。...也可以根据多个键（列）进行合并，用on传入一个由列名组成的列表即可。...（2）将‘长格式’旋转为‘宽格式’ 2、转换数据（1）数据替换，将某一值或多个值用新的值进行代替。（比较常用的是缺失值或异常值处理，缺失值一般都用NULL、NAN标记，可以用新的值代替缺失标记值）。...也可以使用字典的形式来进行替换。（2）离散化或面元划分，即根据某一条件将数据进行分组。利用pd.cut（）方式对一组年龄进行分组。默认情况下，cut对分组条件的左边是开着的状态，右边是闭合状态。

6K8 0

pandas库的简单介绍（2）

3.1 DataFrame的构建 DataFrame有多种构建方式，最常见的是利用等长度的列表或字典构建（例如从excel或txt中读取文件就是DataFrame类型）。...另外一个构建的方式是字典嵌套字典构造DataFrame数据；嵌套字典赋给DataFrame，pandas会把字典的键作为列，内部字典的键作为索引。...[列名]进行移除；增加列有两个方法：1，直接frame[列名]=值；2，frame[列名]=Series对象，如果被赋值的列不存在，会生成一个新列。...计算两个索引的交集 union 计算两个索引的并集 delete 将位置i的元素删除，并产生新的索引 drop 根据传入的参数删除指定索引值，并产生新索引 unique 计算索引的唯一值序列 is_nuique...不常用的特性感兴趣的可自行探索。 4.1 重建索引 reindex是pandas对象的重要方法，该方法创建一个符合条件的新对象。

2.3K1 0

对比Excel，更强大的Python pandas筛选

fr=aladdin')[1] 按单个条件筛选数据框架从世界500强列表中选择中公司，我们可以使用.loc[]来实现。注意，这里使用的是方括号而不是括号()。...如果不需要新数据框架中的所有列，只需将所需的列名传递到.loc[]中即可。例如，仅需要选择最新排名、公司名称和营业收入，我们可以执行以下操作。注意，它只返回我们指定的3列。...看看下面的Excel屏幕截图，添加了一个新列，名为“是否中国”，还使用了一个简单的IF公式来评估一行是否“总部所在国家”为中国，该公式返回1或0。实际上，我正在检查每一行的值。...当你将这个布尔索引传递到df.loc[]中时，它将只返回有真值的行（即，从Excel筛选中选择1），值为False的行将被删除。...在现实生活中，我们经常需要根据多个条件进行筛选，接下来，我们将介绍如何在pandas中进行一些高级筛选。

3.9K2 0

python数据科学系列：pandas入门详细教程

为了沿袭字典中的访问习惯，还可以用keys()访问标签信息，在series返回index标签，在dataframe中则返回columns列名；可以用items()访问键值对，但一般用处不大。...或字典（用于重命名行标签和列标签） reindex，接收一个新的序列与已有标签列匹配，当原标签列中不存在相应信息时，填充NAN或者可选的填充值 set_index/reset_index，互为逆操作，...自然毫无悬念 dataframe：无法访问单个元素，只能返回一列、多列或多行：单值或多值（多个列名组成的列表）访问时按列进行查询，单值访问不存在列名歧义时还可直接用属性符号" ....isin/notin，条件范围查询，即根据特定列值是否存在于指定列表返回相应的结果 where，仍然是执行条件查询，但会返回全部结果，只是将不满足匹配条件的结果赋值为NaN或其他指定值，可用于筛选或屏蔽值...例如，以某列取值为重整后行标签，以另一列取值作为重整后的列标签，以其他列取值作为填充value，即实现了数据表的行列重整。

13.8K2 0

Series计算和DataFrame常用属性方法

Series的布尔索引从Series中获取满足某些条件的数据，可以使用布尔索引然后可以手动创建布尔值列表 bool_index = [True,False,False,False,True] scientists...只需要将布尔值作为索引就可以获得对应的元素 sci[sci['Age']>age_mean] Series 的运算 Series和数值型变量计算时，变量会与Series中的每个元素逐一进行计算两个Series...0开始的索引如果提前写好行索引的列表，可以用set_index引入进来，也可以直接写入列表内容加载数据的时候，也可以通过通过index_col参数，指定使用某一列数据作为行索引 movie2 = pd.read_csv...，再赋值回去 3.通过dataframe[列名]添加新列 4.使用insert()方法插入列 loc 新插入的列在所有列中的位置（0,1,2,3...) column=列名 value=值 # index...] = '导演' columns[3] = '时长' movie2.columns = columns # 将修改后的列表命名为数据的全部列名

811 0

Pandas 25 式

rename()方法改列名是最灵活的方式，它的参数是字典，字典的 Key 是原列名，值是新列名，还可以指定轴向（axis）。 ? 这种方式的优点是可以重命名任意数量的列，一列、多列、所有列都可以。...使用 Python 内置的 glob 更方便。 ? 把文件名规则传递给 glob()，这里包括通配符，即可返回包含所有合规文件名的列表。...不过，用 isin() 方法筛选会更清晰，只要传递电影类型的列表就可以了。 ? 如果想反选，可在条件前添加一个波浪符（tilde ~）。 ? 14....这时，要用 agg() 方法，把多个聚合函数的列表作为该方法的参数。 ? 上列就算出了每个订单的总价与订单里的产品数量。 19....要解决这个问题得用 transform() 方法，这个方法执行同样的计算，但返回与原始数据行数一样的输出结果，本例中为 4622 行。 ?

8.4K0 0

筛选功能（Pandas读书笔记9）

今天和大家分享如果使用Pandas实现单、多条件筛选、模糊筛选。还是老套路，我们需要先读取一组数据作为测试文件。...这里两个数字都是闭合的，案例中[7:11]则选取的是第8行至第12行（pandas从0开始编号）二、提取任意列 1、按照列名提取单列 ? 2、按照列名提取多列 ?...四、单条件筛选筛选其实就是将某列符合特殊条件的筛选出来，那我们先设立一个小目标！将涨跌额为正数的筛选出来！如何判断？无外乎为大于小于等于判断咯！ ?...df['涨跌额']是选出涨跌额这一列我们看到使用判断后返回的是一个布尔型的数据，是一个TRUE和FALSE的集合体。那我们如何将这个布尔型的数据实现筛选的功能呢？ ?...我们将这个布尔型数据作为一个参数，外面套上原始数据和中括号即可！就实现了筛选功能。原理就是布尔型数据为真的话，罗列出来！

5.9K6 1

一文介绍Pandas中的9种数据访问方式

导读 Pandas之于日常数据分析工作的重要地位不言而喻，而灵活的数据访问则是其中的一个重要环节。本文旨在讲清Pandas中的9种数据访问方式，包括范围读取和条件查询等。 ?...通常情况下，[]常用于在DataFrame中获取单列、多列或多行信息。具体而言：当在[]中提供单值或多值（多个列名组成的列表）访问时按列进行查询，单值访问不存在列名歧义时还可直接用属性符号" ...."访问切片形式访问时按行进行查询，又区分数字切片和标签切片两种情况：当输入数字索引切片时，类似于普通列表切片；当输入标签切片时，执行范围查询（即无需切片首末值存在于标签列中），包含两端标签结果，无匹配行时返回为空...例如，当标签列类型（可通过df.index.dtype查看）为时间类型时，若使用无法隐式转换为时间的字符串作为索引切片，则引发报错 ? 切片形式返回行查询，且为范围查询 ?...4. isin，条件范围查询，一般是对某一列判断其取值是否在某个可迭代的集合中。即根据特定列值是否存在于指定列表返回相应的结果。 5. where，妥妥的Pandas仿照SQL中实现的算子命名。

3.7K3 0

Pandas

进行切片，对行的指定要使用索引或者条件，对列的索引必须使用列名称，如果有多列，则还需要借助[]将列名称括起来。...='raise') #labels接收单个列名或者多个列名的列表或者列的索引或者行索引。...中的列名作为列名称为’variable’的列的取值的，'value’列为原列对应取值的一个df。...传入一个函数名组成的列表，则会将每一个函数的函数名作为返回值的列名,如果不希望使用函数名作为列名，可以将列表中的元素写成类似’(column_name,function)'的元组形式来指定列名为name...()方法将 series 中的相同值看作一个类别，分别返回各个类别的记录数量，即频次，并根据 sort 的值决定是否按频次排序。

9.1K3 0

Pandas 秘籍：1~5

更多除了insert方法的末尾，还可以将新列插入数据帧中的特定位置。insert方法将新列的整数位置作为第一个参数，将新列的名称作为第二个参数，并将值作为第三个参数。...如果传递了字符串，它将返回一维序列。如果将列表传递给索引运算符，它将以指定顺序返回列表中所有列的数据帧。步骤 2 显示了如何选择单个列作为数据帧而不是序列。...通过名称选择列是 Pandas 数据帧的索引运算符的默认行为。步骤 3 根据类型（离散或连续）以及它们的数据相似程度，将所有列名称整齐地组织到单独的列表中。...手动排序此秘籍中的列容易受到人为错误的影响，因为很容易错误地忘记新列列表中的列。步骤 5 通过将新的列顺序作为列表传递给索引运算符来完成重新排序。现在，这个新顺序比原来的要明智得多。...这在第 3 步中得到确认，在第 3 步中，结果（没有head方法）将返回新的数据列，并且可以根据需要轻松地将其作为列附加到数据帧中。axis等于1/index的其他步骤将返回新的数据行。

37.2K1 0

Pandas用了一年，这3个函数是我最的最爱……

01 assign 在数据分析处理中，赋值产生新的列是非常高频的应用场景，简单的可能是赋值常数列、复杂的可能是由一列产生另外一个一列，对于这种需求pandas有多种方法实现，但个人唯独喜欢assign，...注意事项： assign赋值新列时，一般用新列名=表达式的形式，其中新列名为变量的形式，所以不加引号（加引号时意味着是字符串）； assign返回创建了新列的dataframe，所以需要用新的dataframe...对象接收返回值； assign不仅可用于创建新的列，也可用于更新已有列，此时创建的新列会覆盖原有列。...尤其是query也是类似于SQL中where关键字的语法逻辑，用起来会很顺滑。 ? 例如对于以上dataframe，需要根据不同场景查询满足条件的记录，调用query的实现方式为： ?...注意事项： query中也支持inplace参数，控制是否将查询过滤条件作用于dataframe本身；与eval类似，query中也支持引用外部函数。

1.8K3 0

（数据科学学习手札72）用pdpipe搭建pandas数据分析流水线

pdpipe作为专门针对pandas进行流水线化改造的模块，为熟悉pandas的数据分析人员书写优雅易读的代码提供一种简洁的思路，本文就将针对pdpipe的用法进行介绍。...图5 ColRename: 　　这个类用于对指定列名进行重命名，其主要参数如下： rename_map：字典，传入旧列名->新列名键值对　　下面是举例演示：列重命名 # 将budget重命名为...图6 ColReorder: 　　这个类用于修改列的顺序，其主要参数如下： positions：字典，传入列名->新的列下标键值对　　下面是举例演示：修改列位置 # 将budget从第0列挪动为第...图13 2.2.2 col_generation col_generation中包含了从原数据中产生新列的若干功能： AggByCols: 　　这个类用于将指定的函数作用到指定的列上以产生新结果...：str型，用于定义结果列的名称（因为ApplyToRows作用的对象是一整行，因此只能形成一列返回值），默认为'new_col' follow_column：str型，控制结果列插入到指定列名之后，默认为

1.4K1 0

数据分析篇 | PyCon 大咖亲传 pandas 25 式，长文建议收藏

rename()方法改列名是最灵活的方式，它的参数是字典，字典的 Key 是原列名，值是新列名，还可以指定轴向（axis）。 ? 这种方式的优点是可以重命名任意数量的列，一列、多列、所有列都可以。...使用 Python 内置的 glob 更方便。 ? 把文件名规则传递给 glob()，这里包括通配符，即可返回包含所有合规文件名的列表。...不过，用 isin() 方法筛选会更清晰，只要传递电影类型的列表就可以了。 ? 如果想反选，可在条件前添加一个波浪符（tilde ~）。 ? 14....这时，要用 agg() 方法，把多个聚合函数的列表作为该方法的参数。 ? 上列就算出了每个订单的总价与订单里的产品数量。 19....要解决这个问题得用 transform() 方法，这个方法执行同样的计算，但返回与原始数据行数一样的输出结果，本例中为 4622 行。 ?

7.1K2 0

高效的10个Pandas函数，你都用过吗？

Insert Insert用于在DataFrame的指定位置中插入新的数据列。默认情况下新列是添加到末尾的，但可以更改位置参数，将新列添加到任何位置。...，则 loc=0 column: 给插入的列取名，如 column='新的一列' value：新列的值，数字、array、series等都可以 allow_duplicates: 是否允许列名重复，选择...Ture表示允许新的列名与已存在的列名重复接着用前面的df：在第三列的位置插入新列： #新列的值 new_col = np.random.randn(10) #在第三列位置插入新列，从0开始计算...Where Where用来根据条件替换行或列中的值。如果满足条件，保持原来的值，不满足条件则替换为其他值。默认替换为NaN，也可以指定特殊值。...) 参数作用： frame：它是指DataFrame id_vars [元组, 列表或ndarray, 可选]：不需要被转换的列名，引用用作标识符变量的列 value_vars [元组, 列表或ndarray

4.1K2 0

案例 | 用pdpipe搭建pandas数据分析流水线

pdpipe作为专门针对pandas进行流水线化改造的模块，为熟悉pandas的数据分析人员书写优雅易读的代码提供一种简洁的思路，本文就将针对pdpipe的用法进行介绍。...: 　　这个类用于修改列的顺序，其主要参数如下： positions：字典，传入列名->新的列下标键值对下面是举例演示：修改列位置 # 将budget从第0列挪动为第3列 pdp.ColReorder...：图13 2.2.2 col_generation col_generation中包含了从原数据中产生新列的若干功能： AggByCols: 　　这个类用于将指定的函数作用到指定的列上以产生新结果（...：str型，用于定义结果列的名称（因为ApplyToRows作用的对象是一整行，因此只能形成一列返回值），默认为'new_col' follow_column：str型，控制结果列插入到指定列名之后，默认为...当columns参数设置为None时，这个参数传入的列名列表中指定的列将不进行哑变量处理，默认为None，即不对任何列进行排除 drop_first：bool型或str型，默认为True，这个参数是针对哑变量中类似这样的情况

7811 0

利用NumPy和Pandas进行机器学习数据处理与分析

本篇博客将介绍Pandas的基本语法，以及如何利用Pandas进行数据处理，从而为机器学习任务打下坚实的基础。什么是Series？Series是pandas中的一维标记数组。...它类似于Python中的列表或数组，但提供了更多的功能和灵活性。我们可以使用Series来存储和操作单个列的数据。...DataFrame是pandas中的二维表格数据结构，类似于Excel中的工作表或数据库中的表。它由行和列组成，每列可以有不同的数据类型。...字典的键表示列名，对应的值是列表类型，表示该列的数据。我们可以看到DataFrame具有清晰的表格结构，并且每个列都有相应的标签，方便阅读访问和筛选数据我们可以使用索引、标签或条件来访问和筛选数据。...例如，要添加一列数据，可以将一个新的Series赋值给DataFrame的一个新列名# 添加列df['Gender'] = ['Male', 'Female', 'Male', 'Female']print

1742 0

python pandas 基础之一

value_counts(), 返回各个不同的元素，并计算元素在Series中的个数。 isin(), 用来判断所属关系，判断给定的一列元素是否包含在Series数据结构中。isin()返回布尔值。...(ding) 将列表作为index传给Series： colors=['red','green','blue','yellow'] s=pd.Series(ding, index=colors) Series...获取索引的列表：frame.index 获取所有的元素：frame.values 获取一列，用列名称即可：frame['price'],返回一个Series对象另一种获取列的方法：frame.price...frame(frame.isin([1,'pen']))得到一个新的DataFrame,包含满足条件的值，其他值为NaN....转置：frame.T 用嵌套字典生成DataFrame对象，pandas会将外部的键当作列名称，将内部的键当作index索引。

1.3K5 0

Pandas_Study01

data.loc[:,['列一','列四','列三']] #取出所有行多列，就把列名包裹成列表的形式。...data.loc[0:5,['列一','列四','列三']] #取出某几行某几列，把行索引和列名传入。...['a', 'c'] # 按标签信息，传入行列标签索引信息获取具体某个数据 df.iat[1, 2] # 按位置信息，传入行列位置信息，获取具体某个数据 # 新版本中pandas中 df 似乎不能使用...pandas 常用函数 pandas中的函数一般会有两种结果，一是copy，即返回一个修改后的副本，原有的不变，二是inplace，即在原有基础上直接进行修改。...2. add() 和 append() 方法 add 类似+ 运算，将两个series 相加得到结果，append 则是将一个series 连接在前一个series的后面，类似列表的相加。

1681 0

Pandas read_csv 参数详解

read_csv 函数具有多个参数，可以根据不同的需求进行灵活的配置。本文将详细介绍 read_csv 函数的各个参数及其用法，帮助大家更好地理解和利用这一功能。...index_col: 用作索引的列编号或列名。usecols: 返回的列，可以是列名的列表或由列索引组成的列表。dtype: 字典或列表，指定某些列的数据类型。...用作行索引的列编号或列名index_col参数在使用pandas的read_csv函数时用于指定哪一列作为DataFrame的索引。...如果设置为None（默认值），CSV文件中的行索引将用作DataFrame的索引。如果设置为某个列的位置（整数）或列名（字符串），则该列将被用作DataFrame的索引。...在实际应用中，根据数据的特点和处理需求，灵活使用 read_csv 的各种参数，可以更轻松、高效地进行数据读取和预处理，为数据分析和建模提供更好的基础。

2201 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭