首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

盘点4种方法处理42w行数据精确的提取到其中的年度信息

早岁那知世事艰,中原北望气如山。

大家好,我是Python进阶者。

一、前言

前几天在Python最强王者交流群【金光灿灿】问了一个Pandas处理字符串数据的问题。问题如下:亲们问个问题:现在有1列数据,约42w行,字段名为PatientID,字段内长度不一,经统计共有下列5种,示例如下,问,我该如何精确的提取到其中的年度信息。

二、实现过程

方法一

这里【吴超建】给了一个思路:086028000A 替换成'',截取前 4 位即是年份。代码如下所示:

方法二

后来【FiNε_】也给了一个思路:不用定义 一行代码能否搞定。答案是肯定的,代码如下所示:

方法三

【猫药师Kelly】看完数据之后,也给了一个思路:按照字母split一下,取前4位就是年份了。代码如下所示:

方法四

【瑜亮老师】这里还提出了正则表达式的解决办法,如下所示:

代码写完后如下所示:

思路一下子就打开了,4种方法,任君挑选!

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OPp17She-gUCwVrI41Uk9FBA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券