在数据集中查找分类列和数值列的个数可以通过以下步骤实现:
read_csv()
函数加载CSV格式的数据集。info()
函数可以查看数据集的基本信息。value_counts()
函数可以统计分类列的个数,使用describe()
函数可以统计数值列的个数。以下是一个示例代码:
import pandas as pd
# 加载数据集
data = pd.read_csv('dataset.csv')
# 探索数据集
data.info()
# 确定分类列和数值列
categorical_columns = []
numerical_columns = []
for column in data.columns:
if data[column].dtype == 'object':
categorical_columns.append(column)
else:
numerical_columns.append(column)
# 统计分类列和数值列的个数
num_categorical_columns = len(categorical_columns)
num_numerical_columns = len(numerical_columns)
print("分类列个数:", num_categorical_columns)
print("数值列个数:", num_numerical_columns)
在这个示例代码中,我们首先使用read_csv()
函数加载数据集,然后使用info()
函数查看数据集的基本信息。接下来,我们遍历数据集的所有列,根据数据类型将列分为分类列和数值列。最后,使用len()
函数统计分类列和数值列的个数,并输出结果。
请注意,以上代码仅为示例,实际应用中可能需要根据具体情况进行适当的调整和优化。
对于腾讯云相关产品和产品介绍链接地址,由于要求不能提及具体品牌商,无法提供相关链接。但可以根据具体需求,在腾讯云官方网站或文档中搜索相关产品和服务,以获取更多信息。
领取专属 10元无门槛券
手把手带您无忧上云