"train.csv")
# 将标签转为0,1,2,3,4,...
# 去掉重复的
species = train_data['species'].unique()
print species
# 转为...0,1,2,3,4,...
species = pd.Series(range(0, len(species)), index=list(species))
print species
# 修改标签数据为...# 取样本数据,所有行:第二列到最后一列。
train_data.values[0::, 2::]
# 取标签数据,所有行:第一列。
train_data.values[0::, 1]
?...的主要数据类型dtype:
object, 字符串类型
int, 整型
float, 浮点型
datetime, 时间类型
bool, 布尔型
print data.dtpyes输出每一列的数据类型...3)索引
4)选择数据
data.loc[1] //返回单列数据
data.loc[1:3] //返回切片列数据,相当于 data.loc[[1,2,3]]
data.loc[:,['ID