Pandas是基于Numpy开发出的,专门用于数据分析的开源Python库
Pandas的两大核心数据结构
Series(一维数据)
允许索引重复
DataFrame(多特征数据,既有行索引...,又有列索引)
# 创建一个3行4列的DataFrame类型数据
data_3_4 = pd.DataFrame(np.arange(10, 22).reshape(3, 4))
# 打印数据
print.../步长)
result.index
# 打印每一列 属性的名称
result.columns
# 将数据放到数组中显示
result.values
# 打印前5个
print("-->前5个:")
print...user_id"])
u_o_g = pd.merge(u_o, goods_info, how="left", on=["goods_name", "goods_name"])
建立交叉表(用于计算分组的频率...)
# 交叉表, 表示出用户姓名,和商品名之间的关系
user_goods = pd.crosstab(u_o_g["姓名"],u_o_g["goods_name"])
Pandas的分组和聚合(重要)