首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >打印utf-8编码字符串

打印utf-8编码字符串
EN

Stack Overflow用户
提问于 2011-03-05 18:08:33
回答 2查看 88.1K关注 0票数 29

我正在使用BeautifulSoup从超文本标记语言中提取一些文本,但我就是想不出如何正确地将其打印到屏幕上(或者打印到文件中)。

下面是包含文本的类的外观:

代码语言:javascript
复制
class Thread(object):
    def __init__(self, title, author, date, content = u""):
        self.title = title
        self.author = author
        self.date = date
        self.content = content
        self.replies = []

    def __unicode__(self):
        s = u""

        for k, v in self.__dict__.items():
            s += u"%s = %s " % (k, v)

        return s

    def __repr__(self):
        return repr(unicode(self))

    __str__ = __repr__

在尝试打印Thread实例时,我在控制台上看到了以下内容:

代码语言:javascript
复制
~/python-tests $ python test.py
u'date = 21:01 03/02/11 content =  author = \u05d3"\u05e8 \u05d9\u05d5\u05e0\u05d9 \u05e1\u05d8\u05d0\u05e0\u05e6\'\u05e1\u05e7\u05d5 replies = [] title = \u05de\u05d1\u05e0\u05d4 \u05d4\u05de\u05d1\u05d7\u05df '

不管我怎么尝试,我都不能得到我想要的输出(上面的文本应该是希伯来语)。我的最终目标是将Thread序列化为一个文件(使用json或pickle),并能够读回它。

我在Ubuntu 10.10上用Python 2.6.6运行它。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-03-05 18:13:42

要将Unicode字符串输出到文件(或控制台),您需要选择文本编码。在Python中,默认的文本编码是ASCII,但要支持希伯来语字符,您需要使用不同的编码,如UTF-8:

代码语言:javascript
复制
s = unicode(your_object).encode('utf8')
f.write(s)
票数 26
EN

Stack Overflow用户

发布于 2014-02-24 03:47:31

@mark答案的一个很好的替代方法是设置环境变量PYTHONIOENCODING=UTF-8

c.f.Writing unicode strings via sys.stdout in Python

(确保在启动Python之前设置它,而不是在脚本中。)

票数 11
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5203105

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档