前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2019年Pandas官方用户调研

2019年Pandas官方用户调研

作者头像
hankleo
发布2020-09-17 10:16:59
3460
发布2020-09-17 10:16:59
举报
文章被收录于专栏:Hank’s BlogHank’s Blog
代码语言:javascript
复制
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

%matplotlib inline

plt.rcParams['figure.dpi'] = 150

# 让 matplotlib 支持中文
plt.rcParams['font.sans-serif'] = ['SimHei']

# 让 seaborn 的文字大一些
sns.set( font='SimHei', font_scale=1.2)

# # 让 MacOS 下的 Matplotlib 与 Seaborn 支持中文
# plt.rcParams['font.family'] = ['Arial Unicode MS']
# sns.set_style('whitegrid',{'font.sans-serif':['Arial Unicode MS','Arial']})


# 用来正常显示负号,这里其实用不上
plt.rcParams['axes.unicode_minus'] = False

df = pd.read_csv("data/2019.csv.zip", parse_dates=['日期时间'], encoding="GBK")

# df.head()
代码语言:javascript
复制
order = [
    '少于 3 个月',
    '3 个月 至 1 年',
    '1 至 2 年',
    '3 至 5 年',
    '5 年以上',
]

sns.countplot(y='您用 pandas 多久了?',
              data=df, order=order,
              color='k').set(title="您用 pandas 多久了?",
                             ylabel="")
sns.despine()
代码语言:javascript
复制
order = [
    "刚开始用",
    "偶尔",
    "每周",
    "每天"
]

sns.countplot(y='pandas 使用频率', data=df, order=order,
              color='k').set(title="pandas 使用频率",
                             ylabel="")
sns.despine()
代码语言:javascript
复制
pct_format = "{:0.2%}".format

df['Python 是您的主打语言吗?'].str.replace(
    "否.*", "否").value_counts(normalize=True).apply(pct_format)

是 90.67% 否 9.33% Name: Python 是您的主打语言吗?, dtype: object

这里用 0.25 版推出的 explode 方法定义了个函数

代码语言:javascript
复制
def split_and_explode(s):
    return s.str.split(";").explode().to_frame()

Pandas API

代码语言:javascript
复制
sns.countplot(y='您常用哪个读写器读取数据?',
              data=df['您常用哪个读写器读取数据?'].str.split(';').explode().to_frame(),
              color='k').set(title="您常用哪个读写器读取数据?",
                             ylabel="")
sns.despine();
代码语言:javascript
复制
sns.countplot(y='处理 100 列及以上大型 DataFrame 的频率',
              data=df, color='k').set(title="处理大型 DataFrame 的频率",
                                      ylabel="");
sns.despine()
代码语言:javascript
复制
sns.countplot(y='Pandas 满意度',
              data=df[['Pandas 满意度']].dropna().astype(int),
              color='k').set(title="Pandas 满意度",
                             ylabel="")
sns.despine();

参考来源 微信公众号: Python大咖谈(id:pythoniao)

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-09-20 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Pandas API
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档