前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python正则表达式如何匹配中间的内容?

Python正则表达式如何匹配中间的内容?

作者头像
前端皮皮
发布2022-08-17 18:55:09
1.2K0
发布2022-08-17 18:55:09
举报
文章被收录于专栏:前端进阶学习交流

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群【Chloe】问了一道正则表达式处理的问题,如下图所示。

原始数据如下:

代码语言:javascript
复制
df = pd.DataFrame({
    'company_code': ['c0001','c0002','c0003', 'c0003', 'c0004'],
    'address': ['9910 Surrey Ave.','92 N. Bishop Ave.','9910 Golden Star Ave.', '102 Dunbar St.', '17 West Livingston Court']
    })
    
def f(text):
    s = re.findall(r'( *9910)( *Ave.)',text)
    return ''.join(s)

df['new'] = df.address.apply(lambda x:f(x))
df

预期的结果如下图所示:

二、实现过程

方法一

这里【瑜亮老师】一针见血,这个题目的意思就是:取包含9910ave之间的内容,如果是这样,就好办了。

这里【月神】都给了一个正则表达式写法,如下所示。

代码语言:javascript
复制
import pandas as pd
import re

df = pd.DataFrame({
    'company_code': ['c0001', 'c0002', 'c0003', 'c0003', 'c0004'],
    'address': ['9910 Surrey Ave.', '92 N. Bishop Ave.', '9910 Golden Star Ave.', '102 Dunbar St.',
                '17 West Livingston Court']
})


df['new'] = df['address'].map(lambda x: x if re.search(r'9910.*Ave\.', x) else '')
print(df)

运行之后,结果就是想要的了。

这里【月神】和【瑜亮老师】还做了部分解析,大家可以一起学习下。

方法二

后来【瑜亮老师】也提供了一种正则表达式方法,代码如下所示。

代码语言:javascript
复制
import pandas as pd
import re

df = pd.DataFrame({
    'company_code': ['c0001', 'c0002', 'c0003', 'c0003', 'c0004'],
    'address': ['9910 Surrey Ave.', '92 N. Bishop Ave.', '9910 Golden Star Ave.', '102 Dunbar St.',
                '17 West Livingston Court']
})


def f(text):
    s = re.findall(r"(9910.*?Ave\.)", text)
    return ''.join(s)


df['new'] = df.address.apply(lambda x: f(x))
print(df)

正则表达式,yyds!运行之后,结果如下图所示:

方法三

后来【Python进阶者】也给了一个正则表达式写法,只需要将正则那块改成下面的代码即可。

代码语言:javascript
复制
s = re.findall(r'9910.*?Ave.', text)

运行之后,结果可以满足要求。

当然了,上面那个正则表达式中的?也可以去除,一样可以得到结果。

?表明是非贪婪模式,解析如下。

最后给大家安利下re.searchre.findall的区别。

三、总结

大家好,我是皮皮。这篇文章主要盘点了一道正则表达式的问题,文中针对该问题给出了具体的解析和代码实现,还做了贪婪模式和非贪婪模式的探讨,帮助粉丝顺利解决了问题。

最后感谢粉丝【Chloe】提问,感谢【月神】、【瑜亮老师】、【Python进阶者】给出的思路和代码解析,感谢【冯诚】、【dcpeng】、【wangning】等人参与学习交流。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-06-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python共享之家 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、前言
  • 二、实现过程
    • 方法一
      • 方法二
        • 方法三
        • 三、总结
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档