新建一个excel表格(table1.csv)用于案例讲解:
导库
import pandas as pd
import numpy as np
读取数据
df = pd.read_excel('table1....xlsx') # 相对路径
# df = pd.read_excel(r'E:\Anaconda\hc\dataScience\table1.csv') # 绝对路径
显示数据
显示数据的行与列数...df.isnull()
清洗数据
删除空值(dropna函数)
df2 = df.dropna(how='any')
填充空值(fillna函数)
df3 = df.fillna(value=0)
用均值对空值进行填充...:4, :5]
②按位置提取
#[0, 2, 5] 代表指定的行,[0, 1, 5] 代表指定的列
df.iloc[[0, 2, 5],[0, 1, 5]]
按条件提取(isin与loc函数)
①用isin...isin([1])
0 True
1 True
2 True
3 False
4 False
5 True
Name: Sex, dtype: bool
②用loc