简而言之。我有一个Python Pandas数据框,它是使用' read _table‘从Excel文件中读入的。我想从数据中保留一小部分序列,并清除其余的。我知道我可以使用'del data‘’SeriesName‘’逐个删除我不想要的内容,但我更愿意做的是指定要保留的内容,而不是指定要删除的内容。
如果最简单的答案是将现有的数据帧复制到只包含我想要的序列的新数据帧中,然后完整删除现有帧,我会对这个解决方案感到满意……但是,如果这确实是最好的方法,有人能带我走一遍吗?
蒂娅..。我是熊猫的新手。:)
发布于 2013-01-17 01:01:31
您可以使用DataFrame
drop
函数删除列。您必须传递axis=1
选项,它才能在列而不是行上工作。请注意,它返回一个副本,因此您必须将结果分配给一个新的DataFrame
In [1]: from pandas import *
In [2]: df = DataFrame(dict(x=[0,0,1,0,1], y=[1,0,1,1,0], z=[0,0,1,0,1]))
In [3]: df
Out[3]:
x y z
0 0 1 0
1 0 0 0
2 1 1 1
3 0 1 0
4 1 0 1
In [4]: df = df.drop(['x','y'], axis=1)
In [5]: df
Out[5]:
z
0 0
1 0
2 1
3 0
4 1
发布于 2013-01-17 01:03:40
基本上与Zelazny7的答案相同--只是指定要保留的内容:
In [68]: df
Out[68]:
x y z
0 0 1 0
1 0 0 0
2 1 1 1
3 0 1 0
4 1 0 1
In [70]: df = df[['x','z']]
In [71]: df
Out[71]:
x z
0 0 0
1 0 0
2 1 1
3 0 0
4 1 1
*编辑*
您可以通过对Dataframe.columns
对象进行索引/切片来指定大量列。
type(pandas.Index)
的这个对象可以看作是列标签的dict
(具有一些扩展功能)。
请参阅上述示例的扩展:
In [4]: df.columns
Out[4]: Index([x, y, z], dtype=object)
In [5]: df[df.columns[1:]]
Out[5]:
y z
0 1 0
1 0 0
2 1 1
3 1 0
4 0 1
In [7]: df.drop(df.columns[1:], axis=1)
Out[7]:
x
0 0
1 0
2 1
3 0
4 1
发布于 2017-06-16 23:21:15
您还可以在pandas.read_table
中使用usecols
选项指定要保留的列的列表。这也加快了加载过程。
https://stackoverflow.com/questions/14363640
复制相似问题