前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pandas数据清洗-删除没有序号的所有行的数据

pandas数据清洗-删除没有序号的所有行的数据

作者头像
哆哆Excel
发布2022-10-31 15:10:26
1.5K0
发布2022-10-31 15:10:26
举报
文章被收录于专栏:哆哆Excel

pandas数据清洗-删除没有序号的所有行的数据

问题:我的数据如下,要求:我想要的是:有序号的行留下,没有序号的行都不要

【代码及解析】

代码语言:javascript
复制
import pandas as pd

filepath="E:/yhd_python/pandas.read_excel/student.xlsx"

df=pd.read_excel(filepath,sheet_name='Sheet1',skiprows=1)

df.tail()

先导入pands包,用read_excel读取文件,工作表为“Sheet1”,标题在第二行,所以跳过一行skiprows=1
方法:read_excel
pd.read_excel(io,sheetname=0, header=0, skiprows=None, index_col=None,names=None,arse_cols=None,date_parser=None,na_values=None,thousands=None,convert_float=True,has_index_names=None,converters=None,dtype=None, true_values=None,false_values=None,engine=None,squeeze=False,**kwds)

sheetname:默认是sheetname为0,返回多表使用sheetname=[0,1],若sheetname=None是返回全表

header :指定作为列名的行,默认0,即取第一行

skiprows:省略指定行数的数据

skip_footer:省略从尾部数的行数据
**继续**
lst=[]

for index,row in df.iterrows():

   if type(row[0])!=int:

       lst.append(index)

lst

定义一个空列表,用于存储第一列中数据类型不是int的的行号
方法:iterrows() 是在数据框中的行进行迭代的一个生成器,它返回每行的索引及一个包含行本身的对象。

 所以,当我们在需要遍历行数据的时候,就可以使用 iterrows()方法实现了。



df1=df.drop(labels=lst)

删除l列表lst存储的所有行号

【效果图】:

完成

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-08-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 哆哆Excel 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档