首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >将&#39转换为普通字符

将&#39转换为普通字符
EN

Stack Overflow用户
提问于 2012-09-29 03:27:59
回答 2查看 9.8K关注 0票数 13

我在显示内容时遇到问题,我的程序:

代码语言:javascript
运行
复制
#! /usr/bin/python

import urllib
import re

url = "http://yahoo.com"
pattern = '''<span class="medium item-label".*?>(.*)</span>'''

website = urllib.urlopen(url)
pageContent = website.read()
result = re.findall(pattern, pageContent)

for record in result:
    print record

输出:

代码语言:javascript
运行
复制
Masked teen killed by dad
First look in &#39;Hotel of Doom&#39;
Ex-NFL QB&#39;s sad condition
Reporter ignores warning
Romney&#39;s low bar for debates

所以问题是,我应该在我的代码中包含什么,以便将‘转换为字符

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-09-29 03:30:06

在Python2中:

代码语言:javascript
运行
复制
In [16]: text = 'Ex-NFL QB&#39;s sad condition'

In [17]: import HTMLParser

In [18]: parser = HTMLParser.HTMLParser()

In [19]: parser.unescape(text)
Out[19]: u"Ex-NFL QB's sad condition"

在Python3中:

代码语言:javascript
运行
复制
import html.parser as htmlparser
parser = htmlparser.HTMLParser()
parser.unescape(text)
票数 17
EN

Stack Overflow用户

发布于 2019-02-14 02:34:28

Python 3的解决方案

代码语言:javascript
运行
复制
import html
html.unescape(text)
票数 10
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12646177

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档