前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python数据分析之groupby语法糖对分组进行迭代语法糖一:选取一个或多个列

Python数据分析之groupby语法糖对分组进行迭代语法糖一:选取一个或多个列

作者头像
罗罗攀
发布2018-07-03 14:18:20
6640
发布2018-07-03 14:18:20
举报

对于dataframe的groupby聚合函数来说,我们适当了解下语法糖,会对数据分析起到事半功倍的效果。

对分组进行迭代

首先看下各字段的类型

import numpy as np
import pandas as pd
import pymysql
conn = pymysql.connect(host='localhost', user='root', passwd='123456', db='test', port=3306, charset='utf8')
jianshu = pd.read_sql('select * from jianshu1',conn)
jianshu.dtypes

可以看出,view这些字段是整数类型的数据,但这里是object数据,所以我们需要进行数据类型的修改,以view为例。

jianshu['view'] = jianshu['view'].astype('int64')
jianshu.dtypes

把user列作为索引。

jianshu.set_index('user',inplace=True)
jianshu

通过分组后的数据类型为groupby对象,可进行迭代。

jianshu.groupby(jianshu.index)
for name,group in jianshu.groupby(jianshu.index):
    print(name,group)

语法糖一:选取一个或多个列

jianshu.groupby(jianshu.index)[['view']].sum()

语法糖二:数据聚合 通过aggregate或者agg方法

jianshu.groupby(jianshu.index)[['view']].agg(['mean','sum'])
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017.05.15 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 对分组进行迭代
  • 语法糖一:选取一个或多个列
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档