首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何在pandas中对列进行分类并添加新列

在pandas中,可以使用pd.cut()函数对列进行分类,并通过df['新列名']的方式添加新列。

具体步骤如下:

  1. 导入pandas库:import pandas as pd
  2. 创建一个DataFrame对象,假设为df
  3. 使用pd.cut()函数对需要分类的列进行分类,并将结果赋值给新的列名。例如,假设要对名为column_name的列进行分类,可以使用以下代码:
  4. 使用pd.cut()函数对需要分类的列进行分类,并将结果赋值给新的列名。例如,假设要对名为column_name的列进行分类,可以使用以下代码:
  5. 其中,bins是分类的边界值,可以是一个列表或整数;labels是对应分类的标签,可以是一个列表或整数。
  6. 完成以上步骤后,df中将会新增一个名为新列名的列,其中每个元素表示对应行的分类结果。

以下是一个示例代码:

代码语言:txt
复制
import pandas as pd

# 创建一个DataFrame对象
df = pd.DataFrame({'column_name': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]})

# 对列进行分类并添加新列
df['category'] = pd.cut(df['column_name'], bins=[0, 5, 10], labels=['low', 'high'])

# 打印结果
print(df)

输出结果如下:

代码语言:txt
复制
   column_name category
0            1      low
1            2      low
2            3      low
3            4      low
4            5      low
5            6     high
6            7     high
7            8     high
8            9     high
9           10     high

在这个示例中,我们将column_name列的值分为两个分类:低(0-5)和高(6-10),并将分类结果存储在名为category的新列中。

腾讯云相关产品和产品介绍链接地址:

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

领券