首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用Python进行数据清洗

去重和计数

首先利用pd.read_csv函数读取数据,然后预览数据的基本信息。维度为:10037x18。

结果为:

定义去重函数

去重,查看菜品数量

结果为:

也可以对dishes_name字段进行数量统计,然后查看数据的维度实现。

结果为:

也可以用set函数实现。

结果为:

也可以用drop_duplicates方法实现

结果为:

销量和售价的相似度

结果为:

缺失值处理

替换缺失值

结果为:

线性插值

结果为:

拉格朗日插值

结果为:

样条插值

结果为:

定义异常值识别函数

结果为:

另一种眼花缭乱的动作分解

结果为:

用箱线图识别异常值

结果为:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190220G03KYF00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券