获取指定的列和行
import pandas as pd
df = pd.read_csv('xxxx.xls')
获取行操作df.loc[3:6]获取列操作df['rowname']取两列df[['...按索引提取区域行数据值df.reset_index()重设索引df=df.set_index(‘date’)设置 date 为索引df[:‘2013’]提取 2013 之前的所有数据df.iloc[:3,:2]从...0 位置开始,前三行,前两列,这里的数据不同去是索引的标签名称,而是数据所有的位置df.iloc[[0,2,5],[4,5]]提取第 0、2、5 行,第 4、5 列的数据df.ix[:‘2013’,:4...’])]判断 city 列里是否包含 beijing 和 shanghai ,然后将符合条件的数据提取出来pd.DataFrame(category.str[:3])提取前三个字符,并生成数据表
数据筛选...简单数据采样
df.sample(n=3)
手动设置采样权重
weights = [0, 0, 0, 0, 0, 0.5, 0.5]
df.sample(n=2, weights=weights)
采样后不放回