Python使用正则表达式检查书稿中不应该出现的重复字

问题描述:在编写书稿和反复修改书稿时,很容易有多字的情况,例如“用户的的资料”、“需要需要用户输入”,这些不小心的错误用肉眼很难完全发现。但是设定好规则之后,代码是可以非常忠实地完成这个任务的。首先使用代码发现可疑字词,然后再人工确认,可以大幅度提高工作效率。

技术要点:1)正则表达式中[]表示范围;2)正则表达式元字符\num表示序号为num的子模式,其中整个正则表达式序号为0,第一个子模式序号为1,以此类推;3)正则表达式元字符?表示前面的字符可以出现也可以不出现;4)常用汉字的Unicode编码范围为\u4e00-\u9fa5;5)Python扩展库python-docx用来读写Word文档。

参考代码:

运行结果:

原文发布于微信公众号 - Python小屋(Python_xiaowu)

原文发表时间:2018-04-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏java一日一条

有效处理Java异常的三个原则,你知道吗?

在有效使用异常的情况下,异常类型回答了“什么”被抛出,异常堆栈跟踪回答了“在哪“抛出,异常信息回答了“为什么“会抛出,如果你的异常没有回答以上全部问题,那么可能...

18510
来自专栏Android先生

写给小白的android基础面试笔试题(二)

答:这道题呢不管是在笔试中也好面试中也好,会被经常拿来问,因为这里面涉及到的知识点甚多,这里你就要回答什么是Handler机制,有何作用,然后面试官肯定还会问,...

30530
来自专栏北京马哥教育

编写快速安全Bash脚本的建议

作者:oschina 来源:https://www.oschina.net/translate/bash-scripting-quirks-safety-tip...

30180
来自专栏Vamei实验室

Java基础07 包

我们已经写了一些Java程序。之前的每个Java程序都被保存为一个文件,比如Test.java。随后,该程序被编译为Test.class。我们最终使用$java...

215100
来自专栏信数据得永生

JavaScript 编程精解 中文第三版 八、Bug 和错误

321100
来自专栏AndroidTv

分享两个提高效率的AndroidStudio小技巧

这次分享两个 Android Studio 的小技巧,能够有效提高效率和减少犯错,尤其是在团队协作开发中。

429130
来自专栏我的技术专栏

C++设计模式:Template Method

12030
来自专栏FreeBuf

某工业组态软件整数溢出漏洞(CVE-2018-7471)分析

某公司工业组态软件存在整数溢出漏洞,该漏洞是由于stgopenstorage读取失败,返回的错误代码超出int在32位系统中的范围,攻击者可利用该漏洞执行任意代...

11820
来自专栏惨绿少年

Shell编程基础篇-上

1.1 前言 1.1.1 为什么学Shell Shell脚本语言是实现Linux/UNIX系统管理及自动化运维所必备的重要工具, Linux/UNIX系统的底层...

22500
来自专栏佳爷的后花媛

h文件和c文件的区别include本身只是一个简单的文件包含预处理命令,即为把include的后面文件放到这条命令这里,除此之外,没有其它的用处(至少我也样认为).

其实在H文件里写函数也无所谓,只是不符合习惯而已。只要按照以上的格式写,一个H文件添加多少次都无所谓,

24620

扫码关注云+社区

领取腾讯云代金券