前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pandas入门3(dtype+fillna+replace+rename+concat+join)

Pandas入门3(dtype+fillna+replace+rename+concat+join)

作者头像
Michael阿明
发布2020-07-13 14:36:25
4810
发布2020-07-13 14:36:25
举报

5. dtype 数据类型

  • print(wine_rev.price.dtype)float64
  • wine_rev.dtypes,整张表,需要加复数s!!!
代码语言:javascript
复制
country                   object
description               object
designation               object
points                     int64
price                    float64
province                  object
region_1                  object
region_2                  object
taster_name               object
taster_twitter_handle     object
title                     object
variety                   object
winery                    object
critic                    object
test_id                    int32
dtype: object
  • 字符串的数据类型为object
  • astype(),可以进行类型转换
  • wine_rev.points.astype('float64')
代码语言:javascript
复制
0         87.0
1         87.0
2         87.0
3         87.0
4         87.0
          ... 
129966    90.0
129967    90.0
129968    90.0
129969    90.0
129970    90.0
Name: points, Length: 129971, dtype: float64
  • wine_rev.index.dtype,索引的类型是dtype('int64')

6. Missing data 缺失值

6.1 查找缺失值 pd.isnull(),pd.notnull()

缺少值的条目将被赋予值NaN,是Not a Number的缩写。这些NaN值始终为float64 dtype。 要选择NaN条目,可以使用pd.isnull()pd.notnull()

  • wine_rev[pd.isnull(wine_rev.country)]
在这里插入图片描述
在这里插入图片描述

6.2 填补缺失值 fillna(),replace()

  • wine_rev.region_2.fillna('Unknown'),原始数据不改变
  • 还可以把缺失值填成之前出现的第一个非空值,称为回填策略
  • wine_rev.taster_twitter_handle.replace("@kerinokeefe", "@kerino"),把前者替换成后者

7. Renaming and Combining 重命名、合并

7.1 Renaming 重命名

  • 把名字改成我们喜欢的,更合适的,rename(),可以把索引名、列名更改
  • wine_rev.rename(columns={'points':'score'})
在这里插入图片描述
在这里插入图片描述
  • 更改indexwine_rev.rename(index={0:'michael',1:'ming'})index={字典}
在这里插入图片描述
在这里插入图片描述
  • rename_axis(),可以更改行索引、列索引名称
  • wine_rev.rename_axis("酒",axis='rows').rename_axis('特征',axis='columns')
在这里插入图片描述
在这里插入图片描述

7.2 Combining 合并数据

  • concat(),join() 和 merge()
代码语言:javascript
复制
canadian_youtube = pd.read_csv("../input/youtube-new/CAvideos.csv")
british_youtube = pd.read_csv("../input/youtube-new/GBvideos.csv")

pd.concat([canadian_youtube, british_youtube])
代码语言:javascript
复制
left = canadian_youtube.set_index(['title', 'trending_date'])
right = british_youtube.set_index(['title', 'trending_date'])

left.join(right, lsuffix='_CAN', rsuffix='_UK')
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/05/18 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 5. dtype 数据类型
  • 6. Missing data 缺失值
    • 6.1 查找缺失值 pd.isnull(),pd.notnull()
      • 6.2 填补缺失值 fillna(),replace()
      • 7. Renaming and Combining 重命名、合并
        • 7.1 Renaming 重命名
          • 7.2 Combining 合并数据
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档