腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
BeautifulSoup
要
提取
未
引用
的
标签
?
python
、
html
、
web-scraping
、
beautifulsoup
要
获取我尝试
的
id: ids = soup.findAll(lambda tag: tag.name == 'span' and tag.findParent('p', 'intro') and tag.findParent
浏览 4
提问于2019-06-12
得票数 0
回答已采纳
2
回答
为什么
漂亮汤会改变html呢?
python
、
html
、
beautifulsoup
但是,当我将内容传递给
BeautifulSoup
并打印该汤时,它会更改HTML代码 print(soup)ÿþ<html> <title>ARRÊT SERVOS<
浏览 2
提问于2020-07-25
得票数 0
回答已采纳
2
回答
网络抓取视频
python
、
video
、
screen-scraping
我正试图通过在上下载“鲍勃
的
汉堡”
的
一集电视节目来验证概念。任何关于如何用
BeautifulSoup
和请求做视频网络抓取
的</e
浏览 3
提问于2018-11-08
得票数 2
2
回答
Python - HTML到Unicode
python
、
html
、
unicode
我有一个python脚本,在那里我得到了一些html,并使用漂亮
的
汤对其进行解析。下面是我获取HTML
的
方法xml = etree.HTML(html) 当我使用这个
的
时候因此,如果有非unicode字符,我
的
代码不会中断。
浏览 1
提问于2014-11-04
得票数 0
2
回答
从html文本中
提取
表格
beautifulsoup
、
lxml
我正在尝试从页面中
提取
文本并将其保存为dataframe。该页面
未
格式化为
标签
,因此pandas无法直接读取。我尝试使用bs4,但无法
提取
出确切
的
网址。from bs4 import
BeautifulSoup
soup =
BeautifulSou
浏览 38
提问于2019-02-24
得票数 0
回答已采纳
3
回答
如何解析html文件中
的
文本
python
import urllib2from HTMLParser import HTMLParser 我有一个H
浏览 3
提问于2016-10-04
得票数 1
回答已采纳
1
回答
有没有办法从网站上
的
卷影根目录中
提取
信息?
python
、
python-3.x
我正在设置代码来检查任何网址
的
声誉,例如网站"“上
的
未
检测到此URL
的
引擎尝试了requests.get(
浏览 11
提问于2019-07-31
得票数 3
回答已采纳
1
回答
如何通过寻找
标签
中
的
标签
来
提取
标签
中
的
信息?
python
、
html
、
parsing
、
beautifulsoup
、
tags
假设我想
提取
24分钟每集信息或N13信息在评级之下。现在这只是代码
的
一部分,有些span标记不是dark_text类,而是其他类。但是当我寻找持有评级
的
标签
时,当我找到它时,我无法
提取
它是什么级别,因为N13现在在div
标签
下,而不是span下,但是由于我在寻找“等级”或“持续时间”,所以我必须查找“span”标记。,所以如果它找到我
要
找
的
span
标签
,我就不能回到div
标签
。 当我执行一个for循环时,它会打印出所
浏览 0
提问于2018-03-14
得票数 0
回答已采纳
2
回答
使用
BeautifulSoup
抓取产品名称
python
、
python-2.7
、
beautifulsoup
我正在使用
BeautifulSoup
(BS4)构建一个抓取器工具,它允许我从位于“h1”
标签
之间
的
任何TopShop.com产品页面中
提取
产品名称。我不明白
为什么
我写
的
代码不能工作!from urllib2 import urlopenimport re ProductPage
浏览 0
提问于2013-02-15
得票数 0
回答已采纳
1
回答
如何从a标记中
提取
所有的href并测试它们是否以'/‘开头?- Python
python
、
beautifulsoup
我用漂亮汤从a
标签
中
提取
出所有的but,但是其中一些
引用
开始时像"/videos.com“,而不是”www.范本/视频网站“,它们没有域名。所以,我要做
的
是从a标记中
提取
所有的hrefers,但是我想测试它是否以"/“开头,如果是这样,我将添加域"www.example.com”。我想要
的
是: domain_name = '
浏览 2
提问于2017-08-11
得票数 2
回答已采纳
3
回答
获取属性错误:“NoneType”对象没有属性getText
python
、
function
、
beautifulsoup
、
nonetype
我已经写了一半
的
代码,从RSS提要中
提取
标题和链接,但这会导致上述错误。在获取文本时,这两个函数中都存在错误。我想去掉输入
的
标题和链接
标签
的
字符串。from bs4 import
BeautifulSoup
import re a= str(a) a=bsoup.find('link').getText(
浏览 3
提问于2013-10-27
得票数 1
回答已采纳
2
回答
如何在python中使用
BeautifulSoup
获取有意义
的
内容
python
、
html
、
beautifulsoup
我有一些代码可以从这样
的
网页中
提取
身体:-from bs4 import
BeautifulSoup
soup=
BeautifulSoup
(content.content, 'html.parser')printwebpage
浏览 1
提问于2019-11-27
得票数 0
回答已采纳
3
回答
如何使用
BeautifulSoup
查找第一个锚
标签
的
文本
python
、
beautifulsoup
我有一个这样
的
HTML结构 <a href="abc.com"> </a> <ahref="xyz.com">comments</a></p> 我想
提取
第一个锚
标签
的
文本
浏览 1
提问于2016-04-28
得票数 1
2
回答
使用
BeautifulSoup
解析格式错误
的
属性
python
、
html
、
beautifulsoup
我正在尝试
提取
一个包含无效
的
未
转义引号
的
属性:像这样使用
BeautifulSoup
时: soup.find('meta')['content']有没有办法让
BeautifulSoup
把
未
转义
的
引号作为属性
的
一部分,这样结果就是mal"formed
浏览 1
提问于2015-12-18
得票数 4
1
回答
为什么
美丽汤没有从网站中
提取
所有的"a“
标签
python
、
beautifulsoup
我正在学习
BeautifulSoup
,我试着从一个网站中
提取
所有的"a“
标签
。我得到了很多"a“
标签
,但很少被忽略,我很困惑
为什么
会发生这种情况,任何帮助都会受到高度赞赏。我使用
的
链接是:import re res = requests.get('https:/&
浏览 0
提问于2018-08-21
得票数 0
回答已采纳
1
回答
使用
Beautifulsoup
,如何
提取
标签
中
未
嵌入
的
信息
python
、
beautifulsoup
我正在尝试解析这个页面中
的
一些精选信息:"<span class="ha-label">Adresse</span>""<span class</p><p></p>data, links
浏览 56
提问于2018-08-01
得票数 1
回答已采纳
2
回答
从包含br标记
的
td标记中
提取
文本
python
、
python-3.x
、
beautifulsoup
我想从td
标签
中
提取
包含br
标签
的
文本。from bs4 import
BeautifulSoup
soup=
BeautifulSoup
(html, 'html.parser') print(s
浏览 0
提问于2018-03-14
得票数 1
回答已采纳
2
回答
Python BS4美汤HTML.Parser在网站上不起作用
python
、
beautifulsoup
我有Python3.7代码,尝试从以下网站()
提取
足球统计数据。看起来我在BS4美丽汤中使用
的
超文本标记语言解析器根本没有
提取
网站中
的
任何
标签
。我首先尝试
提取
特定
的
标签
,比如表示主队和客队
的
两个不同
的
div
标签
,以及包含球员姓名
的
标签
。当这呈现了一个空
的
标签
列表时,我只是简单地尝试
提取
该网站上
的</em
浏览 26
提问于2019-07-13
得票数 2
回答已采纳
3
回答
有没有更好
的
方法?
python
、
pycharm
当您从某个可迭代
的
实例设置属性时,如下所示: class DogWith100Legs(): for leg_i但PyCharm将突出显示leg_100并显示警告:“
未
解析
的
引用
'leg_100‘for class 'DogWith100Legs’。 我
为什么
要
这样做?我想创建树状对象。就像
BeautifulSoup
一样。)中也有评论,人们说这是一种糟糕
浏览 58
提问于2019-06-19
得票数 0
回答已采纳
2
回答
在Python中解析html后检查元素
的
存在
python
、
python-3.x
、
beautifulsoup
我想检查下面的列表(名为rank1)中是否有"TierRank unranked“元素 <div class="TierRankInfo"><div class="TierRank unranked"> </div> </div> 所以,我像这样编写代码。 rank1 = soup.find("div", {"c
浏览 32
提问于2020-04-14
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
每日读书丨为什么商家要贴上一个新品促销的标签?
网页解析之Beautiful Soup库运用
使用多个Python库开发网页爬虫(一)
Python实例:爬取网页中的一列数据
爬虫入门——详解Python是如何进行网页抓取!
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券