腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
漂亮
的
汤
嵌套
标签
中
获取
重复
python
、
beautifulsoup
、
html-parsing
我正在尝试使用
漂亮
汤
(用lxml调用)来解析html。
在
嵌套
标签
上,我得到了
重复
的
文本 我尝试过只计算没有子代
的
标签
,但是我丢失了数据 给定: <div class="links"> <有没有一种只需一次就能得到结果
的
好方法?
浏览 34
提问于2019-05-24
得票数 0
2
回答
lxml源行返回None
python
、
beautifulsoup
、
lxml
需要
获取
xml
的
行号,同时使用
漂亮
汤和lxml解析它。 xml缺少根标记,因此不能直接使用XML元素tree/lxml。所以用
漂亮
的
汤
刮掉它。需要在
嵌套
字典中保留xml
的
文件名、行号、xml
标签
及其值。无法
获取
行号,同时尝试使用
漂亮
的
汤
/lxml抓取它。print(linenum)返回None,但需要返回xml文件
中
的
浏览 60
提问于2019-06-25
得票数 0
1
回答
美丽
的
汤
刮不出所有的东西
python
、
beautifulsoup
我正在尝试从第一个图像
中
获取
img标记,这样我就可以
获取
图像链接。当我用
漂亮
的
汤
抓取站点时,没有img
标签
(如图2所示)。 我不明白为什么每个网站都有一个img
标签
,但美丽
的
汤
却没有。
浏览 1
提问于2020-03-02
得票数 1
1
回答
获取
一个接一个
的
标签
?
python
、
beautifulsoup
我正在尝试
获取
另一个
标签
之后
的
第一个
标签
,其中包含
漂亮
的
汤
。假设我有这样
的
结果:<span class="b">xxx</span><span class "number">10</span> 我可以使用正则表达式
在</em
浏览 2
提问于2013-06-02
得票数 5
回答已采纳
2
回答
BeautifulSoup排除findAll
中
的
标记
python
、
html
、
beautifulsoup
、
lxml
在
漂亮
汤
中
,如何在使用findAll时排除特定
标签
中
的
标签
。<tr>标记
中
的
标记。soup.findAll(['p']) 上面的代码将
获取
所有的<p>标记,但我需要在<tr>标记中提取<p>标记。
浏览 1
提问于2020-08-13
得票数 4
回答已采纳
1
回答
如何在保持顺序
的
同时,从
漂亮
的
汤
结果集中删除
重复
的
值?
python
、
python-2.7
、
beautifulsoup
、
duplicate-removal
我有一个场景,我
在
一个
漂亮
的
汤
结果集中搜索值,并根据它们
的
内容不同地对待它们,例如: if 'this unique string' in i.text: else:然而,我已经意识到,唯一
的
条件实际上
在
结果集中发生了两次,但是我不需要第二个复制值,因此希望首先从
浏览 0
提问于2013-05-02
得票数 0
2
回答
使用
漂亮
汤
从脚本标记
中
抓取数据
python
、
beautifulsoup
我是一个python美容
汤
库
的
新手,我正在尝试从一个网站
的
highcharts
中
抓取数据。我发现我需要
的
所有数据都位于一个脚本
标签
中
,但是我不知道如何抓取它们(请参见附件)有没有办法使用python
漂亮
的
script从这个脚本
标签
中
获取
数据?
浏览 32
提问于2020-07-07
得票数 1
回答已采纳
4
回答
用
漂亮
汤
在
嵌套
标签
中
查找值
python
、
beautifulsoup
我想从如下所示
的
html块中提取价格值: <span> </span>我尝试了price = soup.find("span", {"class"
浏览 4
提问于2021-03-11
得票数 0
回答已采纳
3
回答
如何使用
漂亮
的
汤
获取
儿童
标签
描述
的
文本
python
、
beautifulsoup
、
html-parsing
我正在用
漂亮
的
汤
从中抓取一些数据ingredients = soup.find('div', {"class": "ings"}).findChildren('p') 它为我提供了成分列表,但带有p
标签
。
浏览 2
提问于2016-08-30
得票数 1
1
回答
如何在
漂亮
的
汤
中
获取
分页数据
python
、
beautifulsoup
、
pagination
我正在尝试从这个特定
的
页面
获取
数据-- 用
漂亮
的
肥皂。因为这个页面包含分页,问题是我只能通过
漂亮
的
汤
获得第一页
的
数据,我想要所有分页页面的数据。锚
标签
调用一些java脚本函数来
获取
下一页
的
数据。
浏览 13
提问于2020-05-18
得票数 0
6
回答
Python Beautifulsoup img
标签
解析
python
、
beautifulsoup
、
image
我正在使用
漂亮
的
汤
来解析'www.youtube.com‘
中
的
所有img
标签
。://www.youtube.com/')tags=soup.findAll('img') 但我没有得到所有的img tags.The获得img
标签
也是无效
的
解析后得到
的
img
标签
与页面源img
标签
浏览 2
提问于2012-05-15
得票数 5
1
回答
只计算
标签
的
外部标记子。
python
、
html
、
web-scraping
、
beautifulsoup
页
的
HTML: <div class="gridBox product " id="quickLookItem-1">-- many more like this. --> 我正在用
漂亮
的
汤
废掉一页。在那个页面
中
,我可以得到一个表单
标签
的
名称。tag = soup.find("
浏览 2
提问于2016-09-23
得票数 1
回答已采纳
1
回答
如何从一个下拉菜单中提取数据使用python
漂亮
的
汤
python
、
web-scraping
、
drop-down-menu
、
beautifulsoup
我试图从一个网站上抓取数据,这个网站有一个多级下拉菜单,每次选择一个项目时,它都会改变子下拉菜单
的
子项目。问题是,对于每个循环,它从下拉项中提取相同
的
子项。选择发生了,但它没有更新项目代表新
的
选择从循环谁能帮助我为什么我没有得到想要
的
结果。也许这是因为我
的
下拉列表是java Script之类
的
。例如,下图中
的
manue: enter code here from selenium.w
浏览 179
提问于2019-05-27
得票数 4
回答已采纳
4
回答
BS4:
在
标签
中
获取
文本
python
、
html
、
parsing
、
html-parsing
、
beautifulsoup
我用
的
是
漂亮
的
汤
。有这样
的
标签
:我只想在锚<a>标记
中
获取
文本,而不是输出
中
的
<small>标记
在
BS4
中
有一个命
浏览 8
提问于2014-08-11
得票数 17
回答已采纳
1
回答
LazyLoadImages和Beautifulsoup web抓取
python
、
beautifulsoup
、
lazy-loading
我正在尝试从一个网站
获取
所有的"img“
标签
(包括"alt”和"src")。一切都很好,但我
在
使用lazyload加载一些图像时遇到了问题(
漂亮
的
汤
找不到任何
标签
,但这些
标签
存在于我
的
浏览器
中
)。image in images: link=image('src') print(n
浏览 14
提问于2021-08-02
得票数 0
1
回答
从标记中提取惟一
的
类名
html
、
python-3.x
、
web-scraping
、
beautifulsoup
我正在把(对我来说)相当大
的
数据刮成一个
漂亮
的
汤
对象。典型
的
抓取结果是600页或更多
的
html标记,有许多
嵌套
的
表。我试图更好地理解结构,以便有效地将数据从表中提取出来。这些
汤
对象中有多达500个表,其中有许多“
重复
”表类。以下是两个例子。<table class="TableClass1"><e
浏览 0
提问于2020-01-10
得票数 0
回答已采纳
2
回答
如何处理
漂亮
汤
中
的
重复
标签
python
、
xml
、
beautifulsoup
kilobyte></memory> <kilobyte>396</kilobyte></swap>如何将整个系统
标签
放在
漂亮
的
汤
中
,而跳过中间
的
标签
。
浏览 1
提问于2014-01-08
得票数 0
2
回答
BeautifulSoup只
在
td标记
中
获取
“通用”文本,而在
嵌套
标记
中
不
获取
任何内容。
python
、
beautifulsoup
假设我
的
html如下所示:...我有个
漂亮
的
汤
做这个: print tag.text 我得
浏览 6
提问于2015-07-07
得票数 7
回答已采纳
1
回答
在
html
中
插入注释
python
、
html
、
python-2.7
、
beautifulsoup
我试着用
漂亮
的
汤
在
html
中
插入一个注释,我想在头关闭之前插入它,我正在尝试这样
的
东西它在</head>之前插入,但是值得到实体编码
的
<!-- #mycomment -->。美丽
的
汤
文档
标签
,但我应该如何插入评论,因为它是。
浏览 1
提问于2014-03-14
得票数 2
回答已采纳
2
回答
漂亮
汤
:
在
html
标签
中
获取
内部内容
python
、
beautifulsoup
我正在开发一个能在html标记
中
翻译文本
的
翻译程序,我使用
的
是
漂亮
的
汤
,因为它是python中最好
的
html解析器之一。</strong></h4> 如果您知道如何提取这些部分,那么它不会在中间删除标记,这样replace就可以
在
主字符串上工作。
浏览 1
提问于2019-07-17
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python爬虫工具利器beautifulsoup
【一起学爬虫】BeautifulSoup库详解
css该如何学习?这里有心人可以借鉴一下
MyBatis之Mapper XML 文件详解 四-JDBC 类型和嵌套查询
MyBatis之Mapper XML 文件详解(四)-JDBC 类型和嵌套查询
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券