这篇文章其实来源于自己的数据挖掘课程作业,通过完成老师布置的作业,感觉对于使用python中的pandas模块读取表格数据进行操作有了更深层的认识,这里做一个整理总结。...本文总结了一些通过pandas读取表格并进行常用数据处理的操作,更详细的参数应该关注官方参数文档
1、读取10行数据
相关参数简介:
header:指定作为列名的行,默认0,即取第一行的值为列名,数据为列名行以下的数据...','#N/A', 'N/A', 'NA', '#NA', 'NULL', 'NaN', '-NaN', 'nan', '-nan', ''
keep_default_na:bool型,决定是否自动转NaN...fillna函数用于替换缺失值,常见参数如下:
value参数决定要用什么值去填充缺失值
axis:确定填充维度,从行开始或是从列开始
limit:确定填充的个数,int型
通常limit参数配合axis...平均值的求解肯定不需要缺失值参与,于是我们先取出某一列不存在的缺失值的所有数据,再取出这一列数据,通过mean函数直接获取平均值。