首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python处理中文标点符号

中文文本中可能出现的标点符号来源比较复杂,通过匹配等手段对他们处理的时候需要格外小心,防止遗漏。以下为在下处理中文标点的时候采用的两种方法: 中文标点集合 比较常见标点有这些: 1 !?...调用zhon包的zhon.hanzi.punctuation函数即可得到这些中文标点。 如果想用英文的标点,则可调用string包的string.punctuation函数可得到: 1 !"...@[\\]^_`{|}~ 因此,比如需要将所有标点符号去除,可以进行以下操作: 1 2 3 4 >>> import re >>> from zhon.hanzo import punctuation...去除标点。。"...punctuation) line = re.sub(re_punctuation, "", line) return line.strip() 清洗完毕后,有时候我们希望按照多个标点符号来分割

8.8K40

临近五一,小林我库了,要跑路吗?

心里慌的一批的小林,跟我的朋友们说了这件事,朋友建议我先第一时间上报给 leader,不要把库的事情瞒着。 于是,小林就向 leader 说了我库事情,本以为会被痛批一顿。...不过你这么一整,我突然想起编译服务器半年没备份,我先备份一下我的编译服务器,防止哪天也被你们库了。” 我:“????” 吃瓜的小伙伴,是不是觉得小林要库跑路了?...哈哈哈,小林没跑路,反而是恢复了回来,所以接下来说说小林是如何「从库到恢复」的。 正文 初探案发现场 来看看小林写的垃圾代码,是如何引发这次的库。 ?...遇到 rm -fr /* 库事件发生,一定要沉住气,稳住心态 本次库事件,之所以小林能幸运的恢复回来,有非常关键两点: 小林发现脚本执行不正常,果断立马的掐断它,没有造成重要的数据库信息被删除,如果掐断的时候再晚一点...小林现在是一个过库没跑路的男人了,Goodbye, 我们下次见。

2.7K20

库跑路技巧 库跑路命令

IT 界的有一个老梗,一次某论坛的数据库管理员抱怨自己老板一直虐待他,结果他一气之下就库跑路了…… 库跑路,这一几乎每个程序员都懂得一个都市传说,让sudo rm -rf成了大佬蒙骗萌新的高频词汇...值得注意的是,犯罪嫌疑人已通过登录账号和IP地址被追查到,并且并非误操作,而是故意库。 好吧,言归正传。本文我们来讨论下,程序员如何优雅地库跑路。 1....文档 # 此大法适用于删除公司的备份文件,因为文档备份很多,你手里的可以微不足道,但是你可以用文档的方法服务器上的文件啊 此法的奥义在与把文件删了再写入乱七八糟的数据,导致硬盘上的东西也无法恢复。...库中 可以即使在root用户下还是有些文件不了,但是这些根本就不会影响到你需要跑路的后果。...库完毕 库完毕大部分命令失效,操作系统以及基本不可以用 重启试试 可以看到系统基本废了,不能用了,库有风险使用需谨慎 开始跑路 8.后记 十二提醒你:道路千万条,数据第一条

3K20

Python遍历列表remove漏解决方案

python系列 遍历列表remove漏解决方案 需求及背景 我有一个需求:保留list_1中含有list_2元素的元素,其他的删除 list_1 = ['魁哥','夭夭', '阿离', '渣姐...既然如此我就是用下标呗 for i in range(len(list_1)): if list_1[i] not in list_2: list_1.remove(list_1[i]...remove(list_1[j]) continue j+=1 print(list_1) 方案一方法的思路: 每次只要删除了,都从上一次的下标继续,如果这次没删除,则下标加一下一个...if list_1[i] not in list_2: list_1.remove(list_1[i]) print(list_1) 方案二方法思路: 将索引倒序,这样不管你怎么,...输出 ['秃头企鹅', '王哥'] 上面用例列表推导式,zip,dict等方法,这些python基础我之前文章有写,大家可以多翻翻。(如果没有,那肯定是我不小心删了。) 最后,祝大家周末愉快!

50120
领券