腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(6471)
视频
沙龙
1
回答
如
何用
BeautifulSoup
从
HTML
文件
中
提取
h1
标签
?
python
、
html
、
web-scraping
、
beautifulsoup
我正在尝试从一个超文本标记语言
文件
中
提取
h1
(或任何头
文件
)头
文件
。://www.le.ac.uk/oerresources/bdra/
html
/page_09.htm');bs=
BeautifulSoup
(
html
, '
html</em
浏览 108
提问于2019-06-30
得票数 1
1
回答
为什么我不能按类抓取
h1
标签
?
python
、
web-scraping
我有以下代码,可以使用
BeautifulSoup
从
网页
中
抓取页面标题(带有c-
h1
-title类)文本: from requests import get for
浏览 23
提问于2020-04-02
得票数 0
1
回答
Python web抓取: google搜索结果
中
的网站
python
、
html
、
web-scraping
、
web-crawler
、
google-crawlers
我想从一个谷歌搜索页面
从
多个网站(例如100+)
提取
信息。我只想
提取
关键信息,例如那些带有<
h1
>、<h2>或<b>或<li>
HTML
标签
的信息等,但我不想
提取
整个段落的<p>。我知道如何
从
google搜索
中
收集网站URL列表;我还知道如何在查看页面的
HTML
后对单个网站进行网络抓取。我使用Request和
BeautifulSoup
来完成
浏览 18
提问于2021-03-31
得票数 1
2
回答
美丽的汤:当两个
标签
有不同的ids时,
提取
两个
标签
之间的所有内容。
python
、
html
、
beautifulsoup
、
tags
= 'good' ></
h1
> from bs4 import
BeautifulSoup
This I <b>don't</b> want <
浏览 5
提问于2022-01-22
得票数 -1
4
回答
如何跳过<span>和漂亮的汤
python
、
python-3.x
、
beautifulsoup
这是我的代码的输出我只想得到项目名称,没有“细节”部分。
浏览 0
提问于2018-01-24
得票数 3
回答已采纳
1
回答
尝试使用Python
从
使用BS4的网站抓取数据
python
、
beautifulsoup
、
pycharm
、
web-crawler
我试图
从
URL(代码中提到)导入数据。当我运行代码时,我不会得到任何信息(比如计划名称和费率),也不会给我容器div
标签
,而不会给出内容。from bs4 import
BeautifulSoup
response=urlopen(URL)
html
浏览 1
提问于2020-07-27
得票数 0
回答已采纳
2
回答
网络抓取视频
python
、
video
、
screen-scraping
我想不出如何从这个网站
提取
视频网址。我使用了Chrome和Firefox web开发工具来确定它是否在iframe
中
,但是使用
BeautifulSoup
搜索iframe来
提取
src urls,会返回与视频无关的链接。哪里是对mp4或flv
文件
的引用(我在开发人员工具中看到它们-尽管禁止单击它们)。如果需要,这里有一些代码。很多教程都说要使用'a‘
标签
,但我没有收
浏览 3
提问于2018-11-08
得票数 2
1
回答
抓取
中
的python
HTML
自定义标记
python
、
beautifulsoup
我试图
从
数据-ldpemail
标签
中
删除信息,而不是整个a标记。import requests from bs4 import
BeautifulSoup
soup =
浏览 3
提问于2020-02-25
得票数 1
回答已采纳
2
回答
美汤:
提取
两个
标签
之间的所有内容
python
、
html
、
beautifulsoup
我正在使用
BeautifulSoup
从
HTML
文件
中
提取
数据。我想获取两个
标签
之间的所有信息。这意味着如果我有一个像这样的
HTML
部分: <
h1
></
h1
><div>This is in a div</div> <
h1
></
浏览 25
提问于2020-09-15
得票数 2
回答已采纳
1
回答
如何使用bs4
从
div内的锚标记
中
获取文本
python
、
python-3.x
、
beautifulsoup
我是bs4的新手,我试图
从
div
中
的锚
标签
中
提取
文本,但通过了我的错误。我的代码:
从
bs4导入
BeautifulSoup
<div class="one"><
h1
>Test 1</
h1
>
浏览 0
提问于2021-10-24
得票数 0
1
回答
Webscraping无法找到Python
中
的所有类
python
、
web-scraping
、
beautifulsoup
我正在尝试使用bs4 Python
从
特定网站
提取
用户信息和日期,但我的代码没有
从
网站中找到所有的类。www.expeditionforum.com/threads/distance-indication-feature.34452/"soup =
BeautifulSoup
(page.text, '
html
.parser') title = soup.find('
h1
浏览 12
提问于2020-03-19
得票数 2
回答已采纳
2
回答
如何使用python的regex
从
文本
文件
中
删除多个标记
python
、
python-3.x
、
regex
、
tags
、
findall
我正在使用Python3.8.3,并尝试
从
附加的文本
文件
中
删除
标签
我想
提取
3个列表-标题,出版日期和文章的正文,并删除
标签
。在下面的代码
中
,我已经能够
从
标题和发布日期中删除
标签
。但是,我无法正确地删除正文中的所有
标签
。在
文件
中
,正文以标记<div class="story-element story-element-text">开始,在下一个<
浏览 7
提问于2021-03-10
得票数 0
2
回答
BeautifulSoup
如何
从
h1
标记
中
删除div元素
python
、
python-3.x
、
beautifulsoup
我已经尝试了使用
BeautifulSoup
解析
html
的以下代码。item_detail_soup =
BeautifulSoup
(
html
, "
html
.parser")
h1
= item_detail_soup.find("
h1
") 我的
H1
解析器输出是: <
h1
class="brand" style="display: block; font-size
浏览 30
提问于2021-10-31
得票数 1
回答已采纳
1
回答
美汤在源
文件
中找到
标签
的位置?
python
、
html
、
beautifulsoup
我正在使用
BeautifulSoup
从
HTML
文件
中
提取
信息。我希望能够捕获信息的位置,即在
HTML
文件
中
的
标签
,BS
标签
对象的偏移量。 有没有办法做到这一点?
浏览 22
提问于2018-03-03
得票数 0
回答已采纳
1
回答
如何根据
从
网站源代码中
提取
的文本
中
的
html
标记对文本进行分类?
python
、
text
是否有方法对
从
HTML
源代码中
提取
的文本进行分类,并将每个单词放在被分类的
HTML
标记下 p - My first paragraph.就像根据
HTML
标签
和元
标签
对所有文本进行分类一样。from bs4.element import Comment def tag_v
浏览 3
提问于2022-03-08
得票数 0
回答已采纳
1
回答
如何使用python和美汤将
html
页面拆分成多个页面
python
、
html
、
beautifulsoup
我有一个简单的
html
文件
,如下所示。实际上,我是从一个wiki页面中
提取
出来的,去掉了一些
html
属性,然后转换成了这个简单的
html
页面。<
html
> <
h1
>draw electronics schematics</
h1
> <p>-- ..aga
浏览 0
提问于2013-01-22
得票数 6
回答已采纳
2
回答
用美汤抓取多个URL
python
、
beautifulsoup
我正在尝试
从
多个URL中
提取
特定的类。
标签
和类保持不变,但我需要我的python程序来抓取所有内容,因为我只是输入了我的链接。以下是我的工作示例:import requestsimport re#scrape elementssoup =
Bea
浏览 0
提问于2016-11-16
得票数 9
1
回答
使用漂亮的汤在多个DIVs中
提取
正确的链接。这不是一个重复的问题
python
、
beautifulsoup
下面的代码
从
具有相同类的多个DIVs中
提取
链接,并正确地打印它们。然而,在每个DIV中有几个链接。我只想
提取
和打印每个DIV
中
的第一个链接。我应该用什么语法来完成这个任务。description/">cars</a></
h1
> <
h1
class="detail_1"><a href="/detailed description/"&
浏览 0
提问于2019-08-19
得票数 0
回答已采纳
1
回答
Python
从
html
文件
p标记中
提取
内容,该标记位于一个组div标记
中
。我被印出来了
python-2.7
、
beautifulsoup
我正在尝试
从
文件
中
提取
一些数据。我正在将空白打印到PyCharm控制台。我想从P
标签
中
得到所有的数据。它在div
标签
下。
HTML
片段是:<
h1
>Test Report</
h1
> <p class='attribute'><strong>Start Time:</st
浏览 3
提问于2016-08-12
得票数 1
回答已采纳
3
回答
以编程方式突出显示
HTML
中
的文本
python
、
html
我有一个原始
HTML
文件
,如下所示(内容可能不时变化,我们只知道它是一个有效的
HTML
文件
): <BODY>当我在浏览器
中
打开它时,如下所示: 现在,我想突出显示这个
HTML
文件
中
的一些文本部分。预期产出: <
HTML
>
浏览 5
提问于2017-07-21
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用Python和BeautifulSoup爬取网站
初识BeautifulSoup
Python爬取网站博客教程并制作成PDF
Python实例:爬取网页中的一列数据
使用多个Python库开发网页爬虫(一)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券