我爬行了一组网站,提取了不同的字符串,其中包含unicode编码的字符,比如'Best places to eat in D\xfcsseldorf‘。我将它们存储在一个PostgreSQL数据库中。当我从数据库中检索前面提到的字符串时:print name
输出为unicode u‘最佳就餐地点D\xfcsse
我在unicode中有一组字符串。当我将这些输出到一个文件并将其打印出来( cat it )时,这会破坏我的bash终端:在加载该文件之后,我将得到“符号沙拉”,其中所有内容都是随意的胡言乱语(包括我的命令提示符)。我知道这可能与字符串是unicode字符串有关。目前,我将它们编码为ascii字符串,如下所示:my_string.encode('ascii','ignore')