文章/答案/技术大牛

发布

社区首页 >问答首页 >python2.7:为什么打印一个中文列表看起来像[u'\u4ed6'，u‘\u 6765\u5230’，u'\u4e86'，u'\u7f51\u6613']？

问python2.7:为什么打印一个中文列表看起来像[u'\u4ed6'，u‘\u 6765\u5230’，u'\u4e86'，u'\u7f51\u6613']？
EN

Stack Overflow用户

提问于 2017-09-27 07:59:05

回答 1查看 100关注 0票数 1

我用“解巴汉语词典”分词。

当我打印一个单词列表时，结果如下：

#!/usr/bin/env python
# -*- coding: utf-8 -*- 
import jieba
import sys
import jieba


s1 = "他来到了网易杭研大厦!"
seg_list = jieba.cut(s1)
lst1 = ", ".join(seg_list)
print lst1
m =lst1.split(', ')
print m[2]
punct = set(u''':!),.:;?]}¢'"、。〉》」』】〕〗〞︰︱︳﹐､﹒﹔﹕﹖﹗﹚﹜﹞！），．：；？｜｝︴︶︸︺︼︾﹀﹂﹄﹏､～￠々‖•·ˇˉ―--′’”([{£¥'"‵〈《「『【〔〖（［｛￡￥〝︵︷︹︻︽︿﹁﹃﹙﹛﹝（｛“‘-—_…''')

filterpuntl = list(filter(lambda x: x not in punct, m))

print filterpuntl[2]

结果如下：

他, 来到, 了, 网易, 杭研, 大厦, !
[u'\u4ed6', u'\u6765\u5230', u'\u4e86', u'\u7f51\u6613', u'\u676d\u7814', u'\u5927\u53a6', u'!']
[u'\u4ed6', u'\u6765\u5230', u'\u4e86', u'\u7f51\u6613', u'\u676d\u7814', u'\u5927\u53a6']

如何将[u'\u4ed6', u'\u6765\u5230' ...]转换成汉字？

当我打印列表中的一个元素时，它是中文：

print m[2]
print filterpuntl[2]

结果是：

他, 来到, 了, 网易, 杭研, 大厦, !
了
了

python-2.7

nlp

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-09-27 08:23:23

u'\u4ed6'是一个汉字。它只是一个不同的表示形式，就像您可以为相同的数字编写0.1或1e-1一样--这是一回事，只是外观不同。

如果您想在打印列表等(它发出对象的repr()形式)时看到正确的符号，请切换到Python3：

$ python3
Python 3.5.2 (default, Aug 18 2017, 17:48:00) 
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> print(['\u4ed6'])
['他']

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46442444

复制

相似问题

问python2.7:为什么打印一个中文列表看起来像[u'\u4ed6'，u‘\u 6765\u5230’，u'\u4e86'，u'\u7f51\u6613']？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问python2.7:为什么打印一个中文列表看起来像[u'\u4ed6'，u‘\u 6765\u5230’，u'\u4e86'，u'\u7f51\u6613']？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问python2.7:为什么打印一个中文列表看起来像[u'\u4ed6'，u‘\u 6765\u5230’，u'\u4e86'，u'\u7f51\u6613']？
EN