前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pandas技巧2

pandas技巧2

作者头像
皮大大
发布2021-03-02 16:28:23
3080
发布2021-03-02 16:28:23
举报

总结下pandas使用的技巧

读取json数据并转成Python格式

计数功能实现

代码语言:javascript
复制
# 方法1
def get_counts(sequence):
    counts = {}  # 将计数值保存在字典中
    for x in sequence:
        if x in counts:
            counts[x] += 1   # 存在则计数加1
        else:
            counts[x] = 1    # 不存在则定为1
    return counts


# 方法2
from collections import defaultdict

def get_counts2(sequence):
  counts = defaultdict(int)
  for x in sequence:
    counts[x] += 1
  return counts

缺失值填充

利用seaborn制作条形堆积图

如何标准化数据

代码语言:javascript
复制
# 标准化过程:使用自定义的标准化函数实现
def normal_total(group):
    group['normed_total'] = group.total / group.total.sum()
    return group

透视表制作

代码语言:javascript
复制
# 按照性别计算平均得分
mean_ratings = data.pivot_table('rating',   # 得分
                                index='title',  # 行索引index
                                columns='gender', # 列属性gender
                                aggfunc='mean')  # 使用的函数:平均分
mean_ratings[:5]

查看文件的前n行

代码语言:javascript
复制
!head -n 10 /Users/peter/data-visualization/pydata-book/datasets/babynames/yob1880.txt
# 查看某个文件的前10行数据

生成DF数据时自定义列属性

多个文件同时合并

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-1-2,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 读取json数据并转成Python格式
  • 计数功能实现
  • 缺失值填充
  • 利用seaborn制作条形堆积图
  • 如何标准化数据
  • 透视表制作
  • 查看文件的前n行
  • 生成DF数据时自定义列属性
  • 多个文件同时合并
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档