腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
将
Unicode
传递给
BeautifulSoup
4
python
、
unicode
、
beautifulsoup
基本上,我想知道我是否能做这样
的
事情:soup =
BeautifulSoup
(
unicode
_text) 我目前正在编写一个模块,它接受一个
Unicode
字符串,使用
BeautifulSoup
4
解析
/修改字符串,然后返回结果我<
浏览 4
提问于2014-08-01
得票数 0
回答已采纳
1
回答
BeautifulSoup
的
Unicode
解析
错误
python
、
python-3.x
、
unicode
、
web-scraping
、
beautifulsoup
以下代码:from urllib.request import urlopen as uReq print(page_soup.find_all('p')) ...produces以下
错误
codec can't encode characte
浏览 4
提问于2017-08-09
得票数 0
回答已采纳
2
回答
Python - HTML到
Unicode
python
、
html
、
unicode
我有一个python脚本,在那里我得到了一些html,并使用漂亮
的
汤对其进行
解析
。下面是我获取HTML
的
方法xml = etree.HTML(html)我得到一个
浏览 1
提问于2014-11-04
得票数 0
1
回答
用美丽汤编码表情符号
python
、
beautifulsoup
、
encode
我正在做一个项目,用Python中
的
“美丽汤”来抓取特定
的
Craigslist帖子。我可以成功地显示在帖子标题中找到
的
表情符号,但在帖子正文中没有成功。我试过不同
的
变体,但到目前为止没有什么效果。clcondensed.txt", "w")soup =
BeautifulSou
浏览 3
提问于2017-04-07
得票数 2
回答已采纳
1
回答
如何以UTF-8
的
形式打开HTML文件进行
解析
?
python-3.x
、
beautifulsoup
、
html-parsing
我试图用python 3使用
BeautifulSoup
来
解析
html文件,但是我得到了UTF-8解码
错误
。我尝试添加选项打开文件解码作为UTF-8,但
错误
仍然出现。
unicode
_html =fp.read().decode('utf-8', 'i
浏览 3
提问于2020-02-26
得票数 0
回答已采纳
1
回答
用Python语言
解析
带有gb2312正文
的
utf-8编码网页
python
、
encoding
、
character-encoding
、
web-scraping
、
beautifulsoup
我正在尝试使用Python漂亮
的
soup
解析
器
解析
网页,但遇到了一个问题。我们从他们那里得到
的
HTML头声明了一个utf-8字符集,因此Beautiful Soup以utf-8对整个文档进行了编码,实际上HTML标签也是以UTF-8编码
的
,所以我们得到了一个结构良好
的
HTML问题是,这个愚蠢
的
网站将gb2312编码
的
正文文本注入到页面中,页面被漂亮
的
汤
解析
为utf-8。有没有办法将文本从"gb2312假装是
浏览 2
提问于2012-08-02
得票数 0
回答已采纳
2
回答
如何防止
BeautifulSoup
4向汤中添加额外
的
<html><body>标记?
python
、
beautifulsoup
在3之前
的
BeautifulSoup
版本中,我可以获取任意块
的
HTML并以这种方式获得字符串表示:soup3 =
BeautifulSoup
('<div><b>soup 3</b></div>') '<div><b>so
浏览 6
提问于2013-04-12
得票数 17
回答已采纳
1
回答
使用
BeautifulSoup
解析
XML中
的
Unicode
对象
错误
python
、
xml
、
unicode
、
beautifulsoup
使用
BeautifulSoup
解析
XML输出中
的
'name‘标记
的
内容会导致以下
错误
: </TABLE_stud> </stud> </show>
浏览 0
提问于2014-04-24
得票数 0
回答已采纳
1
回答
python通用源
解析
器对
unicode
错误
的
崩溃
python
、
unicode
、
beautifulsoup
、
feedparser
我使用OSX10.6和python2.7.1与
BeautifulSoup
3.0和5.01
解析
器5.01。我正试图
解析
“纽约时报”
的
RSS Feed,它验证了“美丽之汤”,它自己也会快乐地
解析
。产生
错误
的
最小代码是:from
BeautifulSoup
import
BeautifulSoup
浏览 0
提问于2011-03-08
得票数 0
回答已采纳
1
回答
从非英语网站获取纯文本内容
java
、
python
、
web-scraping
、
web-crawler
、
non-english
我正在尝试获取非英语网站
的
纯文本内容。例如,我想获取
的
印地语内容这只是一个我正在探索
的
宠物项目。速度并不是什么大问题。我会在Linux环境中编写代码,最好使用Python或Java或C/C++ (按此顺序)。
浏览 0
提问于2011-10-30
得票数 2
1
回答
用
BeautifulSoup
从XML文档中提取
unicode
文本
python
、
xml
、
beautifulsoup
我有这样
的
代码: url = open(fileid, 'r').read() soup =
BeautifulSoup
下面是该列表
的
一个片段集。您可以看到其中分配了许多
unicode
。我怎样才能把这个
unicode
从列表中去掉呢?
浏览 1
提问于2017-05-16
得票数 0
3
回答
使用提取html页面时出现
的
“‘charmap”编解码
错误
python
、
beautifulsoup
import requestssoup=
BeautifulSoup
(page.content, 'lxml-xml')但是,如果我删除'xml‘并离开soup =
BeautifulSoup
(page.content, 'lxml')
浏览 1
提问于2017-05-15
得票数 1
回答已采纳
2
回答
BeautifulSoup
中有关导航字符串和
unicode
的
问题
python
、
beautifulsoup
我在
BeautifulSoup
(python)中
的
导航字符串和
unicode
方面遇到了一些问题。基本上,我正在
解析
来自youtube
的
四个结果页面,并将顶部结果
的
扩展名(youtube.com/watch?=之后
的
url结尾)放入一个列表中。但是,另一个显示为TypeError: '
unicode
' object is not callable。两者使用
的
是完全相同
的
字符串。 我在这里
浏览 4
提问于2012-06-10
得票数 1
3
回答
如何使用
BeautifulSoup
从html中清除标记
python
、
python-3.x
、
beautifulsoup
我完成了第一步,但是在执行第二步时,我得到了以下
错误
:我尽了最大努力去纠正它,但我又犯了同样
的
错误
这是我
的
代码:import urllib.request
浏览 9
提问于2018-01-10
得票数 4
回答已采纳
1
回答
如何使Python在bs4上正常工作?
python
、
xml
、
unicode
、
beautifulsoup
我正在尝试使用4 (bs4)将Inkscape SVG转换成一些专有软件
的
类似XML
的
格式。我似乎无法让bs4正确地
解析
一个最小
的
示例。我需要
解析
器尊重自闭标记,处理
unicode
,而不是添加html内容。我认为用selfClosingTags指定'lxml‘
解析
器应该可以做到这一点,但是没有!去看看。属于获得漂亮汤4尊重自闭标签,没有被接受
浏览 1
提问于2016-03-22
得票数 2
回答已采纳
3
回答
python删除<p>中
的
文本
python
、
regex
、
string
我想要删除html文本块
的
<p>标记内
的
文本。我正在尝试标准化一些文本,并删除所有类、对齐和其他信息。我能找到
的
每个例子似乎都涉及到剥离html,而我不想剥离标签。我只想把它们都弄清楚。所以如果我有这样
的
东西:some paragraph blah blah blah <p class='SomeClassIDontWant
浏览 0
提问于2011-04-14
得票数 0
1
回答
多处理
BeautifulSoup
bs4.element.Tag
python-2.7
、
beautifulsoup
、
pickle
、
python-multiprocessing
我试图与
BeautifulSoup
一起使用多重处理,但遇到了一个maximum recursion depth exceeded
错误
: result= card.find("p") soup =
BeautifulSoup
(url,
浏览 4
提问于2015-08-08
得票数 1
回答已采纳
3
回答
在子线程中创建
BeautifulSoup
对象将打印编码
错误
python
、
multithreading
、
beautifulsoup
、
thread-safety
、
lxml
我写了一个示例代码:from bs4 import
BeautifulSoup
def test():r = requests.get('http://zhuanlan.sina.com.cn/') print('run
浏览 0
提问于2018-03-26
得票数 1
1
回答
python美汤ascii
错误
python
、
ascii
、
beautifulsoup
当我下载一本英文圣经时,我
的
脚本会起作用。但是当我下载一本外国
的
圣经时,它给了我一个ascii
错误
。pythonimport lxml.html as html continue if (os.path.isdir(dirname) == 0): soup =
浏览 2
提问于2012-05-16
得票数 1
回答已采纳
2
回答
我正在尝试使用Python进行web抓取,并提出了如下请求,并得到了响应。但不知道怎么处理
python
、
web-scraping
、
python-requests
此外,请注意,我已更改
的
网址隐私
的
原因。 提前谢谢你
的
帮助。
浏览 1
提问于2021-10-27
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券