1、字段抽取
字段抽取是根据已知列数据的开始和结束位置,抽取出新的列
字段截取函数:slice(start,stop)
注意:和数据结构的访问方式一样,开始位置是大于等于,结束位置是小于。...,拆分已有字符串
字符分割函数:split(sep,n,expand=False)
#类似于excel中的分列功能
参数说明
① sep 用于分割的字符串
② n 分割为多少列(不分割n...=0,分割为两列n=1,以此类推)
③expand 是否展开为数据框,默认为False,一般都设置为True
返回值
① 如果expand为True,则返回DataFrame
② 如果expand为False...'].str.split(' ', 1, True)
newDF.columns = ['band', 'name']
3、记录抽取
根据一定的条件,对数据进行抽取
记录抽取函数:dataframe[...多条件
df[df.comments.between(1000, 10000)]
#过滤空值所在行
df[pandas.isnull(df.title)]
#根据关键字过滤
df[df.title.str.contains