腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5523)
视频
沙龙
1
回答
BeautifulSoup
不
能从
解析
的
html
中找到
所有
标签
吗
?
html
、
python-3.x
、
web-scraping
、
beautifulsoup
HTML
代码来自我
的
原始文件,第91行包含我想要查找
的
标记: <section class="lectsect" id="somesection"> </div> </div> </div>
浏览 13
提问于2019-10-01
得票数 1
1
回答
BeautifulSoup
--防止标记自动关闭
python
、
beautifulsoup
BeautifulSoup
在
解析
以下代码时卡住了:>>> soup.prettify() '<img src="#" alt="Click Here >" />\n&
浏览 3
提问于2011-06-16
得票数 2
5
回答
我可以改变
BeautifulSoup
将XML
标签
转换为小写
的
行为
吗
?
python
、
xml
、
beautifulsoup
我正在编写代码来
解析
用XML编写
的
配置文件,其中XML标记大小写混合,而且大小写很重要。Beautiful默认情况下会将XML标记转换为小写,我想要更改此行为。 我不是第一个问这个问题的人[参见]。然而,我不理解这个问题
的
答案,并且在
BeautifulSoup
-3.1.0.1中,
BeautifulSoup
.py似乎没有包含任何"encodedName“或"Tag.__str__”
的
实例。
浏览 2
提问于2009-05-21
得票数 8
回答已采纳
1
回答
如何从用户定义
的
标记中获取href标记
python
、
beautifulsoup
、
goose
可以帮我从获取
所有
的href
标签
吗
我将这个url加载到goose,并将
html
内容加载到
Beautifulsoup
。检查
html
标签
,发现
所有
的href
标签
都在'datastore‘中,这是一个自定义
标签
。我们怎样才
能从
美丽
的
汤中提取出hrefs呢?article = g.extract(url='https://www.cnoocltd.
浏览 1
提问于2019-08-10
得票数 0
1
回答
Python BS4与SDMX
python
、
python-2.7
、
xml-parsing
、
bs4
、
sdmx
我想检索SDMX文件(如)中给定
的
数据。我尝试使用
BeautifulSoup
,但它似乎看不到
标签
。在下面的代码中from bs4 import
BeautifulSoup
html
_source
浏览 13
提问于2016-09-16
得票数 1
回答已采纳
3
回答
在
HTML
文件中查找
所有
*呈现
的
*图像
python
、
html
、
regex
、
parsing
我需要一种方法,在片段中只找到呈现
的
IMG标记。所以,我不能仅仅用
HTML
片段来查找
所有
的IMG标记,因为我还会得到在
HTML
中显示为文本
的
IMG标记(而不是呈现
的
)。有什么想法
吗
? 谢谢,伊凡
浏览 2
提问于2009-04-07
得票数 0
回答已采纳
2
回答
在Python中使用regex匹配两个字符串中
的
HTML
标记
python
、
html
、
regex
我想验证源字符串中存在
的
HTML
标记是否也存在于目标字符串中。
浏览 0
提问于2010-04-20
得票数 3
回答已采纳
1
回答
美汤低大写
标签
默认?
python
、
beautifulsoup
、
lxml
我用
的
是LXML和漂亮汤。我有一个带有大写标记
的
XML文档。当我使用
BeautifulSoup
时,它似乎是小写
的
标签
名称,这使我使用
的
find_all
不
直观。BS真的是这样做
的
,还是发生了其他事情?soup =
BeautifulSoup
( features= 'lxml', # '
html
5lib', # '
html
浏览 2
提问于2022-05-25
得票数 0
1
回答
使用
BeautifulSoup
解析
HTML
标记
python
、
html
、
python-2.7
、
python-3.x
、
beautifulsoup
我正在
解析
一个有很多超链接
的
网页。通过在<a>
标签
中找到
所有
的“href”,能够使用漂亮汤提取超链接。接下来,我试图获得
所有
这些链接
的
“标题”,这些链接显示为<a>标记
的
标记内容。对于
HTML
来说,我认为这种跟踪描述称为标记内容,对
吗
?下面是一个例子。“哪一种教室环境适合你?”需要提取。感谢你
的
帮助。a href="https://www.nyt
浏览 3
提问于2017-10-12
得票数 1
回答已采纳
1
回答
如何使用
BeautifulSoup
查看闭合
标签
的
总数?
python
、
beautifulsoup
下面的代码检查是否有一个以上
的
打开
html
标签
, <
html
> </
html
>""" soup =
BeautifulSoup
(invalid, '
html
.
浏览 0
提问于2014-03-02
得票数 1
2
回答
BeautifulSoup
:从
html
获取css类
python
、
html
、
css
、
beautifulsoup
有没有办法使用
BeautifulSoup
从
HTML
文件中获取CSS类?text-align': 'justify'}, 'p.c1': {'text-align': 'center'}尽管像这样
的
代码可以
浏览 0
提问于2012-07-16
得票数 8
回答已采纳
2
回答
如何在漂亮
的
汤中获得嵌套元素
python
、
beautifulsoup
我正在努力解决在td中获取一些href所需
的
语法问题。tr和td元素没有任何class或id。< tr >< td ><a >... 谢谢
浏览 0
提问于2009-06-29
得票数 25
回答已采纳
2
回答
如何用
BeautifulSoup
解析
HTML
标签
中
的
HTML
标签
内容?
python
、
html
、
parsing
、
beautifulsoup
在web上发现
的
html
的
唯一情况下,存在在父
html
标签
内具有多个
html
标签
的
HTML
文档。我想
解析
html
标记
的
内容。谁能给我指出这样做
的
方向?soup =
BeautifulSoup
(
html
, "lxml") 仅提供父
ht
浏览 0
提问于2017-06-05
得票数 0
1
回答
BeautifulSoup
解析
表并过滤第二行
python
、
html
、
parsing
、
beautifulsoup
我关注了,并希望过滤br之后
的
所有
内容。flightAirport first">Palma de Mallorca<br><span class="second_row">nach Berlin Tegel</span></td>我尝试过
的
: 从字符串中去掉'nach Berlin‘,得到一个缺少字符
的
字
浏览 70
提问于2018-06-03
得票数 -2
1
回答
BS4:区分大小写
的
搜索
python
、
beautifulsoup
、
case-sensitive
有可能只找到那些大写格式
的
标签
吗
?我有一个
html
页面。有标记<a href=..>和标记<A href=...>。我只想得到<A href=..>格式
的
标签
。当我尝试all = index.findAll('A')时,它什么也
不
返回。如果我尝试all = index.findAll('a'),我也会得到
所有
标签
'a‘和'A’。 谢谢你<e
浏览 5
提问于2014-08-03
得票数 0
回答已采纳
1
回答
使用Python和Mechanize
的
随机形式
的
FIlling
python
、
forms
、
python-2.7
、
mechanize
、
mechanize-python
我很确定我已经通过了通常
的
用户名密码表单
的
第一个页面,但第二个登录页面要求您在帐户创建过程中选择
的
安全问题
的
答案中
的
特定字符。例如,如果你最喜欢
的
宠物叫加菲猫,它要求输入第二个、第四个和第五个字符,你必须填写3个输入a,f,i,并张贴表格。 我不确定让机械化搜索它每次登录时想要
的
字符
的
最好方法是什么。frmentermemorableinformation1:strEnterMemorableInformation_memInfo1">
浏览 0
提问于2013-06-30
得票数 1
回答已采纳
3
回答
HTML
标记之间
的
Selenium
python
、
selenium
、
screen-scraping
、
beautifulsoup
将Javascript创建
的
页面中
的
所有
超文本标记语言传递给
BeautifulSoup
的
最佳方法是什么?我目前使用
的
是:from selenium.common.exceptions import NoSuchElementExceptionfrom selenium.webdriver.common.keys import Keys from
BeautifulSoup
import
Beaut
浏览 1
提问于2012-10-13
得票数 2
5
回答
使用
BeautifulSoup
解析
文档,而不
解析
<code>标记
的
内容
python
、
html
、
django
、
beautifulsoup
、
pygments
我想允许评论作者使用一些
标签
(如<strong>,a等),但禁用
所有
其他
标签
。I like this article, but the third code example <em>could have been simpler</em>: #include <stdio.h&
浏览 0
提问于2010-10-24
得票数 10
1
回答
AttributeError:'str‘对象在使用
BeautifulSoup
时没有属性’子代‘错误
python
、
python-3.x
、
beautifulsoup
@ayivima在下面有一个很好
的
答案,但我要补充
的
是,网站本身最终没有被
BeautifulSoup
正确地刮掉,因为它有大量
的
Javascript。。所以我对Python
的
使用完全陌生,我只是想打印一个网页
的
标题。我使用
的
代码主要来自google:import requests url = "https://www150.pid=3
浏览 0
提问于2019-06-24
得票数 2
13
回答
美汤与按ID抽取div及其内容
python
、
beautifulsoup
soup.find("tagName", { "id" : "articlebody" }) 为什么
不
返回<div id="articlebody"> ... </div>
标签
和中间
的
东西呢?(编辑:我发现
BeautifulSoup
没有正确
解析
我
的
页面,这可能意味着我试图
解析
的
页面格式不正确。)
浏览 65
提问于2010-01-26
得票数 188
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫-Beautiful Soup攻略
BeautifulSoup常用解析库-爬虫干货系列5
享学课堂浅谈Python3中BeautifulSoup的使用方法
爬虫获取所有课程信息
简单爬虫教你理解BeautifulSoup库
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券