首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >删除大熊猫中含有空元组列表的行

删除大熊猫中含有空元组列表的行
EN

Stack Overflow用户
提问于 2017-09-17 04:48:29
回答 2查看 1.1K关注 0票数 4

我有如下所示的数据

代码语言:javascript
运行
复制
name     foo_list
'foo'    [('bleh'), ('blah')]
'bar'    [(), 'boo']
'foobar'  [(), (), ()]

我想删除所有空元组,如果列表中的所有值都是空元组,只需完全删除行即可。另外,我希望将这个元组列表转换为list。所以,输出将是

代码语言:javascript
运行
复制
name     foo_list
'foo'    ['bleh', 'blah']
'bar'    [ 'boo']

我怎么在熊猫身上做这件事?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-09-17 05:10:03

试试这个?

数据输入:

代码语言:javascript
运行
复制
df=pd.DataFrame({'name':['A','B','C'],'foo_list':[[('bleh'),('blah')], [(), 'boo'],[(), (), ()]]})

解决方案:

代码语言:javascript
运行
复制
df['foo_list']=df['foo_list'].apply(lambda x : [t for t in x if t != ()])
df.loc[df['foo_list'].apply(len)>0,:]

Out[20]: 
       foo_list name
0  [bleh, blah]    A
1         [boo]    B

定时(小尺寸)

代码语言:javascript
运行
复制
%timeit df['foo_list'].apply(lambda x : [t for t in x if t != ()])#Wen
10000 loops, best of 3: 117 µs per loop

%timeit df.foo_list.apply(lambda x: filter(None, x)) # John
10000 loops, best of 3: 121 µs per loop

大号将推荐约翰的解决方案

代码语言:javascript
运行
复制
df=pd.concat([df]*10000,0)

%timeit df.foo_list.apply(lambda x: filter(None, x))
100 loops, best of 3: 10.2 ms per loop
%timeit df['foo_list'].apply(lambda x : [t for t in x if t != ()])
100 loops, best of 3: 17.1 ms per loop
票数 4
EN

Stack Overflow用户

发布于 2017-09-17 05:19:29

使用filter删除列表中的空元组。

代码语言:javascript
运行
复制
In [679]: df['foo_list'] = df.foo_list.apply(lambda x: list(filter(None, x)))

使用str.len删除空列表

代码语言:javascript
运行
复制
In [680]: df.loc[df.foo_list.str.len()>0]
Out[680]:
       foo_list name
0  [bleh, blah]    A
1         [boo]    B
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46260758

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档