1、Pandas数据结构
2008年WesMcKinney开发出的库
专门用于数据挖掘的开源python库
以Numpy为基础,借力Numpy模块在计算方面性能高的优势
基于matplotlib,能够简便的画图...(1)增强图表可读性
在numpy当中创建学生成绩表样式:
返回结果:
array([[92, 55, 78, 50, 50],
[71, 76, 50, 48, 96],...通过已有数据创建
举例一:
pd.DataFrame(np.random.randn(2,3))
结果:
举例二:创建学生成绩表
使用np创建的数组显示方式,比较两者的区别。...在pandas中,缺失值使用NaN来标记,如下图所示:
6.1 如何处理nan
按如下步骤进行:
(1)获取缺失值的标记方式(NaN或者其他标记方式)
(2)如果缺失值的标记方式是NaN
1、删除存在缺失值的...result = pd.merge(left, right, how='outer', on=['key1', 'key2'])
结果:
9、高级处理-交叉表与透视表
9.1 交叉表与透视表什么作用