腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2444)
视频
沙龙
3
回答
如何
使用
Beautiful
Soup
将此
文本
驻
留在
标记
中
?
、
、
我想从上面的代码
中
获取数字121。但是我得到的
soup
对象没有显示数字。
浏览 11
提问于2019-06-26
得票数 0
1
回答
从BeautifulSoup对象获取URL
、
有人向我的函数传递了一个
使用
典型调用获得的BeautifulSoup对象(BS4):我的代码: url =
soup
.???
如何
从
soup
对象
中
获取原始URL?我试着阅读文档和BeautifulSoup源代码...我还是不确定。
浏览 2
提问于2019-02-22
得票数 1
回答已采纳
1
回答
Python 3.6美丽的汤-在Web抓取过程
中
获取嵌入式视频URL的麻烦
、
、
、
、
我正在尝试抓取一个网页,并
使用
Python3.6
中
的
Beautiful
Soup
和requests模块检索网页上嵌入的视频的URL。当我在Chrome
中
查看网页上的超
文本
标记
语言时,我可以看到视频的.mp4链接。但是当我
使用
requests和
Beautiful
Soup
获取页面时,我找不到"video“节点。特别是,我想要抓取这个网页- http://videolectures.net&
浏览 25
提问于2020-08-26
得票数 4
1
回答
我在
使用
漂亮的汤查找xml
中
的<name></name>时遇到问题
、
我正在尝试
使用
beautifulsoup.name获取漂亮的汤返回
文本
。但它只是给了我一个美丽汤对象的文档。对于
如何
使用
Beautiful
返回XML文件
中
的
文本
,有什么建议吗?import BeautifulSoup as bsoup
soup
= bsoup(f) But I'
浏览 3
提问于2014-06-28
得票数 0
回答已采纳
2
回答
Python3:从字符串
中
移除超
文本
标记
语言,所有的例子都是简单的“仅标签”移除
这是一个字符串: Blah Blah Blah <div><div>sometext</div></div> (我想要的)-删除所有HTML后剩下的内容,包括内部
文本
,以便我获得: Blah BlahBlah (我不想要的)我找到的所有示例都只是针对标签的,它是这样做的: Blah Blah Blah sometext 我需要任何曾经包装在HTML标签
中
的东西被移除,即使它是纯
文本
。
浏览 36
提问于2021-02-06
得票数 1
回答已采纳
3
回答
如何
使用
Beautiful
Soup
提取HTML
标记
中
的特定
文本
?
、
、
、
、
我有一个这样的HTML
标记
: "<li><span class="bold-title">Starts:</span> October 2013</li>
浏览 0
提问于2013-05-25
得票数 0
回答已采纳
1
回答
Python web抓取<a>之间的访问值</a>
、
假设我有这样的html代码:<a aria-current="page" aria-label="Current page" href="https://name_webpage.com/">1</a>
如何
使用
浏览 2
提问于2021-02-18
得票数 0
2
回答
在获取table HTML数据时,
如何
在Selenium Python
中
获取一个没有
文本
值的```<td>```
标记
?
、
并不是每个<td>都有
文本
值,而且每一行都不同(不同列
中
的无
文本
值) 因此,当我
使用
row.text时,它会返回一个列表,忽略没有
文本
的列表。每一行的列表具有不同的长度。这不利于在excel文件
中
写入列表。 如果我这样做的话,一个接一个的<td>组成一个列表。这太慢了。cbd</a></td> <tr> <td>ttt</td>
浏览 24
提问于2019-06-10
得票数 2
回答已采纳
1
回答
如何
使用
Beautiful
Soup
检索<strong>
标记
后面的
文本
?
、
我尝试
使用
Beautiful
Soup
在所有strong元素之后拉取所有
文本
值。strong><br/>$ 1,140.00我想将以下所有值放入一个列表
中
:我一直在
使用
以下内容将我想要的数据值的标题拉到列表
中
:import re
浏览 0
提问于2020-11-17
得票数 0
2
回答
美汤找不到桌子
、
我正在尝试用Python和
Beautiful
Soup
从网页上的一个表格
中
收集一些数据。然而,当我从页面中进行选择时,我得到的结果与在浏览器
中
得到的结果不同。具体地说,这些表完全缺失。这是我从
Beautiful
Soup
得到的输出: ? 我尝试过
使用
urllib而不是request,也尝试过
使用
不同的超
文本
标记
语言解析器(html.parser和lxml)。关于这里可能发生的事情以及我
如何
绕
浏览 15
提问于2020-04-25
得票数 0
回答已采纳
1
回答
Pandas:将列表理解转换为
使用
应用
、
、
我目前有一个包含
beautiful
_
soup
列的Pandas DataFrame (它包含一个BeautifulSoup对象)。我想为几个超
文本
标记
语言标签(例如,img标签的数量)添加一个列。例如,这是我
使用
列表理解的旧代码:但是
使用
a
浏览 6
提问于2017-08-15
得票数 0
1
回答
使用
Beautiful
Soup
从字符串
中
剥离html
标记
、
有没有人有一些示例代码来演示
如何
使用
Python的
Beautiful
Soup
从
文本
字符串
中
剥离除某些以外的所有html
标记
?
浏览 0
提问于2010-12-13
得票数 5
回答已采纳
2
回答
很难用漂亮的汤刮网
、
、
我正在尝试
使用
Beautiful
Soup
来提取工作的头衔。span
标记
中
的标题与
文本
相同。
文本
是'Barista‘,但标题也是。到目前为止,我一直在
使用
.findall,但我不知道它是
如何
工作的。
浏览 28
提问于2021-07-26
得票数 0
回答已采纳
1
回答
使用
BeautifulSoup在网页上查找特定
文本
、
、
、
、
我正在尝试保存一个
使用
Python 3和
Beautiful
Soup
4的网站上的电影列表。问题是,我对Python和BS非常陌生,我真的不知道从哪里开始。我不知道
如何
提取那块数据。我一直在谷歌搜索,似乎
Beautiful
Soup
在试图查找标签时效果最好,但我只需要它来找到一个
文本
列表,而不是在任何特定的标签
中
(该网站不是专业设计的)。有没有办法让
Beautiful
Soup
和Python提取“过去的电影:”和“对
浏览 3
提问于2016-05-12
得票数 6
回答已采纳
1
回答
BeautifulSoup :从html
标记
中提取/解析数据
、
、
、
我试图
使用
Python代码
中
的
Beautiful
从url中提取体育数据。这个数据源的问题是数据出现在html
标记
中
。具体来说,这个标签的标题是"“print(
soup
.match)<match
浏览 5
提问于2021-04-08
得票数 0
回答已采纳
2
回答
在Python 3
中
,抓取隐藏在标签
中
的网页上的所有
文本
、
、
我需要抓取一个网页(),但我遇到了一个问题--我需要在首页显示的
文本
绝对隐藏在许多不同的格式化
标记
中
。我知道
如何
使用
Beautiful
Soup
抓取常规页面,但这并不能满足我的需要(例如,
文本
丢失,一些标签通过...)from bs4 import BeautifulSoup'w', encoding='utf-8') as outfile: for url in url
浏览 1
提问于2014-09-09
得票数 0
2
回答
抓取动态超
文本
标记
语言(YouTube注释)
、
、
、
、
有了
Beautiful
Soup
和Request Library,我可以抓取超
文本
标记
语言的内容,但不能抓取JavaScript或AJAX调用的内容。import requests url = 'https:/
浏览 1
提问于2017-11-01
得票数 3
1
回答
在BeautifulSoup中
使用
.select()从网页
中
拉取数字时
使用
哪些CSS选择器?
、
我正在尝试
使用
python从一个网页上拉取当前的股票价格。我在
使用
Beautiful
Soup
拉取数字时遇到了问题。我不知道该
使用
什么CSS选择器。注意,我想要的数字是368.45: 下面是我的python3代码的精髓(如果有必要的话,我
使用
Ubuntu ):
soup
= bs4.BeautifulSoup(res.text, "
浏览 54
提问于2018-06-19
得票数 1
2
回答
通过python加载网站内容
、
如何
通过python从网站加载特定内容?例如,我想加载博客的一些帖子并将它们显示在我自己的site.How
中
。我可以这样做吗?
浏览 2
提问于2011-03-25
得票数 1
1
回答
当给定从Selenium webdriver获得的超
文本
标记
语言数据时,BeautifulSoup
如何
从超
文本
标记
语言中获取
文本
、
、
、
我能够从页面
中
获得超
文本
标记
语言的内容,但是当我可视化它的BeautifulSoup内容时,数据似乎缺少
文本
信息,而我所看到的只有脚本信息。(Image: soupstr output)然而,当我显式地调用.text到
Beautiful
soup
对象时,我得到了所有的
文本
。(图片: souptext输出) Code snippet Image: soupstr output Image: souptext output
如何
在Python上
使用
浏览 22
提问于2021-02-24
得票数 -1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券