本文概述
Pandas 是数据科学家做数据处理时,使用最多的工具。
对比Excel,我们可以发现:Pandas基本可以实现所有的Excel的功能,并且比Excel更方便、简洁,其实很多操作我们在过去的文章中,或多或少都讲述过。
但是在数据框上,完成各种“条件格式”的设置,帮助我们更加凸显数据,使得数据的展示更加美观,今天还是头一次讲述。
上图左表展示的是某班级期末考试的成绩数据,我们要利用左表完成如右表的效果展示,需要完成的目标如下:
(1)将“均值”这一列的数值,保留1位小数;
(2)给这份数据,添加一个标题辅助说明“高三(5)班期末考试成绩”,方便我们区分数据;
(3)隐藏索引列(注意最左边!);
(4)隐藏指定列,有些列我们不作处理,可以不做展示;
(5)将“语文”这一列的数值,依数值大小画条状图;
(6)将“均值”这一列数据最大的值,高亮(highlight)展示;
(7)将“数学”这一列的数值,依数值画一个绿色的colormap;
(8)将整个DataFrame 的空值显示为红色,着重突出;
一行代码即可上述所有操作
用过Pyecharts的朋友可能都知道“链式规则”,在这里我们同样可以采用这种方法,用一行代码就可以实现上述所有的功能。
1. 读取数据
结果如下:
2. 一行代码
结果如下:
使用说明
这个是Pandas0.17.1中的新功能。官方文档中说到:这是一项新功能,正在积极开发中。我们将添加功能,并可能在将来的版本中进行重大更改。
上面我们直接一行代码实现所有的功能,如果我们只想实现某一个功能怎么办呢?
好了,今天就为大家介绍到这里,赶紧下去尝试吧!
更多阅读
领取专属 10元无门槛券
私享最新 技术干货