前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >盘点4种方法用Python批量提取[]括号内的第一个元素

盘点4种方法用Python批量提取[]括号内的第一个元素

作者头像
Python进阶者
发布2022-06-05 09:22:38
6270
发布2022-06-05 09:22:38
举报

葡萄美酒夜光杯,欲饮琵琶马上催。

大家好,我是Python进阶者。

前言

前几天在才哥交流群里边遇到一个叫【上海-数据分析-小粒】的粉丝提了一个小问题,如下:

数据如下:

咋一看,这个题目倒是也确实不太难,群里提供思路的人也很多,一起来看看吧!

思路和实现方法

针对这个问题,群里的小伙伴纷纷献策,这里盘点4个思路和实现方法。

方法一

下面是【北京-数分-阿汤】大佬给的思路,使用列表切两次,分别以一次逗号,一次括号,要做判断,如果没逗号就切括号;还有就是写正则。

方法二

下面是【深圳-运营-梧桐】大佬给的思路,使用excel分列,先根据逗号分列,然后分别将括号[]替换掉,几秒钟的事。

方法三

下面是【武汉-优化算法-derek】大佬给的思路和代码实现,本质上也是切片处理。

不过产品经理发话了,有的数据没逗号,需要加条规则,把右括号先替换为逗号,然后就有了下面的结果:

方法四

下面是【常州-销售-MT】大佬给的思路和【北京-金融-Bran】大佬给的代码实现,使用lambda x:eval(x)转列表,用apply效率应该能提高一些,代码如下:

代码语言:javascript
复制
df['新增一列']=df.数据1.apply(lambda x:x.replace('[','').replace(']',''))
df.新增一列=df.新增一列.str.split(',',expand=True)[0]

但是需要注意:原来字符串不能直接搞成list,否则就都拆散了。

总结

这篇文章基于粉丝提问,盘点了4种方法针对模板字符串进行分割和提取,总的来说,用apply会快很多,因为apply跟lambda可以简化很多操作,而且lambda里面也可以写判断语句,很方便。

最后感谢【上海-数据分析-小粒】粉丝提问,感谢【北京-数分-阿汤】、【深圳-运营-梧桐】、【武汉-优化算法-derek】、【常州-销售-MT】、【北京-金融-Bran】大佬给出的思路和代码。当然方法肯定还不只是上面4种,也欢迎大家多多发散思维,提出新的方法。

小伙伴们,快快用实践一下吧!

------------------- End -------------------

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-05-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 思路和实现方法
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档