这篇文章其实来源于自己的数据挖掘课程作业,通过完成老师布置的作业,感觉对于使用python中的pandas模块读取表格数据进行操作有了更深层的认识,这里做一个整理总结。...,如果数据文件中没有列标题行,就需要执行header=None
name_columns = [' ','名字','类型', '城市', '地区', '地点', '评分', '评分人数', '价格']...fillna函数用于替换缺失值,常见参数如下:
value参数决定要用什么值去填充缺失值
axis:确定填充维度,从行开始或是从列开始
limit:确定填充的个数,int型
通常limit参数配合axis...可以用于替换数量方向的控制
我们这里根据需求,最简单的就是将需要修改的这一列取出来进行修改,之后对原数据进行列重新赋值即可
name_columns = [' ','名字','类型', '城市', '地区...平均值的求解肯定不需要缺失值参与,于是我们先取出某一列不存在的缺失值的所有数据,再取出这一列数据,通过mean函数直接获取平均值。