我有如下所示的数据
name foo_list
'foo' [('bleh'), ('blah')]
'bar' [(), 'boo']
'foobar' [(), (), ()]我想删除所有空元组,如果列表中的所有值都是空元组,只需完全删除行即可。另外,我希望将这个元组列表转换为list。所以,输出将是
name foo_list
'foo' ['bleh', 'blah']
'bar' [ 'boo']我怎么在熊猫身上做这件事?
发布于 2017-09-17 05:10:03
试试这个?
数据输入:
df=pd.DataFrame({'name':['A','B','C'],'foo_list':[[('bleh'),('blah')], [(), 'boo'],[(), (), ()]]})解决方案:
df['foo_list']=df['foo_list'].apply(lambda x : [t for t in x if t != ()])
df.loc[df['foo_list'].apply(len)>0,:]
Out[20]:
foo_list name
0 [bleh, blah] A
1 [boo] B定时(小尺寸)
%timeit df['foo_list'].apply(lambda x : [t for t in x if t != ()])#Wen
10000 loops, best of 3: 117 µs per loop
%timeit df.foo_list.apply(lambda x: filter(None, x)) # John
10000 loops, best of 3: 121 µs per loop大号将推荐约翰的解决方案
df=pd.concat([df]*10000,0)
%timeit df.foo_list.apply(lambda x: filter(None, x))
100 loops, best of 3: 10.2 ms per loop
%timeit df['foo_list'].apply(lambda x : [t for t in x if t != ()])
100 loops, best of 3: 17.1 ms per loop发布于 2017-09-17 05:19:29
使用filter删除列表中的空元组。
In [679]: df['foo_list'] = df.foo_list.apply(lambda x: list(filter(None, x)))使用str.len删除空列表
In [680]: df.loc[df.foo_list.str.len()>0]
Out[680]:
foo_list name
0 [bleh, blah] A
1 [boo] Bhttps://stackoverflow.com/questions/46260758
复制相似问题