我有一个字符串,看起来像这样:
6Â 918Â 417Â 712
修剪这个字符串的最简单的方法(就我所理解的Python)是,简单地说这个字符串在一个名为s
的变量中,我们得到:
s.replace('Â ', '')
这应该能起到作用。但是,它当然会抱怨文件blabla.py中的非ASCII码字符'\xc2'
没有编码。
我从来都不太理解如何在不同的编码之间切换。
这是代码,它确实和上面的一样,但是现在它在上下文中。该文件在记事本中另存为UTF-8,并具有以下标题:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
代码:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
它不会超过s.replace
..。
https://stackoverflow.com/questions/1342000
复制相似问题