前言
在抓取网页信息时经常遇到很多头尾加了空格的字符串,在此介绍几种处理的小技巧。
例子
1.
woodenrobot
2....= soup.stripped_strings
print('a: %s\nb: %s\nc: %s\nd: %s\ne: %s' % (a, b, c, list(d), list(e)))
输出结果如下...= soup.stripped_strings
print('a: %s\nb: %s\nc: %s\nd: %s\ne: %s' % (a, b, c, list(d), list(e)))
输出结果...woodenrobot1woodenrobot2
d: [' woodenrobot1', ' woodenrobot2 ', ' ']
e: ['woodenrobot1', 'woodenrobot2']
通过结果我们知道对于复杂一点的特殊结构这个三种方法还是有一些差异存在...,所以我们需要根据不同的需求选择不同的方法。