场景:把列表中的数据拼接成一个字符串
In [1]: li = [3, 'cxk', 'kk', 'caibi']
In [2]: ''.join([str(i) for i in li])
Out[2]: '3cxkkkcaibi'
推荐使用生成器表达式,如果列表很大,可以节省很多内存空间
In [3]: ''.join(str(i) for i in li)
Out[3]: '3cxkkkcaibi'
场景:把某个字符串依据分割符号拆分不同的字段,该字符串包含多种不同的分隔符
s = "ab;fd/ft|fs,f\tdf.fss*dfd;fs:uu}fsd"
场景:比如某目录下有一系列文件:
编写程序给其中所有 .txt 文件和 .py 文件加上用户可执行权限
解决方案:
使用字符串 str.startswith() 和 str.endswith()
找出以 .txt 和 .py 结尾的文件,其接受一个元组
>>> import os
>>> os.listdir(".")
['app', 'config', 'requirements.txt', 'run.py', '__pycache__', 'gunicorn.conf.py', 'chromedriver', 'login_after2.png', 'readme.txt', 'slide.png', 'test.py', 'logs', 'chrome-linux.zip', 'gunicorn.pid', 'asgi.py', 'chrome-linux']
>>> [name for name in os.listdir(".") if name.endswith((".txt", ".py"))]
['requirements.txt', 'run.py', 'gunicorn.conf.py', 'readme.txt', 'test.py', 'asgi.py']
实际案列:例如在日志文件中,其中日期格式为'yyyy-mm-dd':
我们想把其中的日期改为美国日期格式'mm/dd/yyyy'.比如 2019-06-12 改成 06/12/2019 格式
解决方案:使用 re 中的 sub() 方法做字符串替换
利用正则表达式中的捕获组,捕获每个部分的内容,然后在替换在替换的字符串中调整各个捕获组的顺序!
代码如下:
import re
with open("info.log", "r", encoding="utf-8") as f:
file = f.read()
print(re.sub('(\d{4})-(\d{2})-(\d{2})', r'\2/\3/\1', file))
捕获组中每组需要用括号括起来,然后默认从左至右分为组1, 组2…
下一个参数是我们要替换的格式,用 1,2,3 分别表示组1, 组2…
运行结果如下:
解决方案:
实际案例:
解决方案:
(adsbygoogle = window.adsbygoogle || []).push({});