前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一日一技:在字符串中批量替换单个字符

一日一技:在字符串中批量替换单个字符

作者头像
青南
发布2019-05-23 18:20:11
9890
发布2019-05-23 18:20:11
举报
文章被收录于专栏:未闻Code未闻Code

在我们使用爬虫爬取下来的数据中可能混有很多不需要的字符,例如:

代码语言:javascript
复制
address = '浙江省杭州市\r\n滨江区xx小区7#门'

我现在需要移除里面的 \r\n、把 #替换为 。你可能会这样写代码:

代码语言:javascript
复制
clean_address = address.replace('\r', '')clean_address = address.replace('\n', '')clean_address = address.replace('#', '号')

这样的写法,处理几个字符还行,但如果要处理几百个特殊符号,那就很困难了。

所以当我们要处理很多的字符串替换时,可能会有一个配置文件来记录替换关系:

代码语言:javascript
复制
need_replace = {'\n': '', '\r': '', '#': '号'}

在这种情况下,我们可以使用字符串的 translate方法来实现替换:

代码语言:javascript
复制
address = '浙江省杭州市\r\n滨江区xx小区7#门'need_replace = {'\n': '', '\r': '', '#': '号'}table = str.maketrans(need_replace)clean_address = address.translate(table)

运行效果如下图所示:

使用这种方式,可以让代码看起来更加简洁,也更方便配置。

不过当需要替换的字符串比较少时, translate的效率比 replace低。并且 translate只能实现多个单字符的替换,不能替换多字符的字符串,例如:

代码语言:javascript
复制
address = '浙江省杭州市</p>滨江区'

如果要把 </p>整体替换为空,就不能使用 translate方法。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 未闻Code 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档