我试着分析我从tweeter得到的一些tweet,但似乎我有一个编码问题,如果你有任何想法的话。
import json
#Next we will read the data in into an array that we call tweets.
tweets_data_path = 'C:/Python34/TESTS/twitter_data.txt'
tweets_data = []
tweets_file = open(tweets_data_path, "r")
for line in tweets_file:
try:
tweet = json.loads(line)
tweets_data.append(tweet)
except:
continue
print(len(tweets_data))#412 tweets
print(tweet)我得到了这样的错误:文件"C:\Python34\lib\encodings\cp850.py",第19行,在encode return codecs.charmap_encode(input,self.errors,encoding_map)中unicodeEncodeError:'charpmap‘编解码器无法对位置1345的字符'\u2026’进行编码:字符映射到未定义
在工作中,我没有得到这个错误,但我使用的是python 3.3,你认为这有什么不同吗?
-编辑
来自@MarkRamson的评论回答了我的问题
发布于 2015-02-09 05:13:44
您应该在打开文件时指定编码:
tweets_file = open(tweets_data_path, "r", encoding="utf-8-sig")https://stackoverflow.com/questions/28399404
复制相似问题