我正在尝试使用unicode变量进行字符串格式化。例如:
>>> x = u"Some text—with an emdash."
>>> x
u'Some text\u2014with an emdash.'
>>> print(x)
Some text—with an emdash.
>>> s = "{}".format(x)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2014' in position 9: ordinal not in range(128)
>>> t = "%s" %x
>>> t
u'Some text\u2014with an emdash.'
>>> print(t)
Some text—with an emdash.您可以看到我有一个unicode字符串,而且它打印得很好。问题是当我使用Python新的(和改进的?) format()函数时。如果我使用旧的样式(使用%s),一切正常,但是当我使用{}和format()函数时,它失败了。
你知道为什么会发生这种情况吗?我使用的是Python 2.7.2。
发布于 2011-11-16 22:00:15
当你混合使用ASCII码和unicode字符串时,新的format()就不那么宽宏大量了。所以试试这个:
s = u"{}".format(x)发布于 2011-11-16 22:00:18
同样的方式。
>>> s = u"{0}".format(x)
>>> s
u'Some text\u2014with an emdash.'发布于 2017-06-14 15:31:29
使用下面的方法对我来说效果很好。它是其他答案的变体。
>>> emDash = u'\u2014'
>>> "a{0}b".format(emDash)
'a—b'https://stackoverflow.com/questions/8152820
复制相似问题