我正在尝试将文件的内容读入列表中。但是,文件内容可能包含一些非ASCII字符。我在读取时使用了"utf-8“编码,在向列表中插入时也对读取的每一行进行了编码。当我尝试打印列表时,它仍然显示非ASCII格式的字符。我希望它是一个普通的字符串,这样我就可以执行一些字符串操作,比如find。任何帮助都将不胜感激。
编写的代码-
import os
import io
f = io.open(os.path.join(path,"temp.txt"),mode="r",encoding="utf8")
lines = [line.encode('utf-8').rstrip('\n') for line in f]
print lines
发布于 2018-07-11 08:49:13
当你用encoding="utf8"
打开和读取文件时,它已经为你解码了。后面的line.encode('utf-8')
只会使其成为bytearray
,而不再是纯文本。删除.encode('utf-8')
,应该就没问题了。
https://stackoverflow.com/questions/51275629
复制相似问题