使用BeautifulSoup从HTML中提取地址标签_使用Beautifulsoup从HTML标签中提取数据_如何使用Beautifulsoup从HTML标签中提取数据 - 腾讯云开发者社区

python-3.x、beautifulsoup

似乎无法将以下HTML字符串： [<address class="styles_address__zrPvy"><svg class="styles_addressIcon__3Pu3L" height-- -->Sydney</address>] "title“可以正常工作，但"address”不能提取。")): soup = BeautifulSoup(open(mark

浏览 13提问于2021-01-21得票数 1

3回答

如何使用BeautifulSoup查找第一个锚标签的文本

python、beautifulsoup

我有一个这样的HTML结构 <a href="abc.com"> </a> <ahref="xyz.com">comments</a></p>下

浏览 1提问于2016-04-28得票数 1

2回答

Python BS4美汤HTML.Parser在网站上不起作用

python、beautifulsoup

我有Python3.7代码，尝试从以下网站()提取足球统计数据。看起来我在BS4美丽汤中使用的超文本标记语言解析器根本没有提取网站中的任何标签。我首先尝试提取特定的标签，比如表示主队和客队的两个不同的div标签，以及包含球员姓名的标签。当这呈现了一个空的标签列表时，我只是简单地尝试提取该网站上的所有div标签，但我仍然得到了一个空列表。下面是我使用</em

浏览 26提问于2019-07-13得票数 2

回答已采纳

1回答

我正在尝试用Python抓取QS世界大学排名

python、beautifulsoup

我试图从QS排名网站中提取大学名称，排名和学术声誉。(地址如下)“学术声誉”数据在“排名指标”选项卡中。首先，我尝试用Python获取大学名称，但没有成功。这段代码似乎给出了很多'a‘标签数据，但我无法获得带有"uni-link“类的大学名称。import requests url="https://www.topuniversit

浏览 3提问于2021-11-25得票数 0

1回答

使用python中的BeautifulSoup从url的源代码中提取特定部分下的文本

python、html、url、beautifulsoup、scrape

我是python的初学者，对HTML没有真正的经验。我刚看了一段关于网络抓取的youtube视频()，并对从python的URL中提取文本感兴趣。html = urlopen(url) type(soup)(str_c

浏览 4提问于2021-08-23得票数 0

回答已采纳

1回答

Python web抓取: google搜索结果中的网站

python、html、web-scraping、web-crawler、google-crawlers

我想从一个谷歌搜索页面从多个网站(例如100+)提取信息。我只想提取关键信息，例如那些带有<h1>、<h2>或<b>或<li> HTML标签的信息等，但我不想提取整个段落的<p>。我知道如何从google搜索中收集网站URL列表；我还知道如何在查看页面的HTML后对单个网站进行网络抓取。我使用Request和BeautifulSoup来完成

浏览 18提问于2021-03-31得票数 1

1回答

使用Beautifulsoup从HTML标签中提取数据

python-3.7

我正在尝试从下面的html中提取经验字段。<html><head></head><body> <span使用监督学习和无监督学习构建了一些中等规模的机器学习模型。软件工程实习生，Proxbotics Creations Technol

浏览 12提问于2019-08-23得票数 0

1回答

美汤在源文件中找到标签的位置？

python、html、beautifulsoup

我正在使用BeautifulSoup从HTML文件中提取信息。我希望能够捕获信息的位置，即在HTML文件中的标签，BS标签对象的偏移量。有没有办法做到这一点？我目前使用的是lxml解析器，因为它是默认的。

浏览 22提问于2018-03-03得票数 0

回答已采纳

2回答

Python中脚本标记的Web抓取

python、json、selenium、web-scraping、beautifulsoup

我已经设法使用BeautifulSoup.Then获取脚本标记，我将其转换为json对象。我想要的信息在data['x']中，但它被卡在b标记之间。infoinwant</br>columniwant: 123','<b>infoiwant</b><br>NA<br>columniwant: 123'</br>columniwant: 123 我该如何从这些b元素中获取信息

浏览 5提问于2020-09-11得票数 0

1回答

刮黄埔餐厅地址

python-3.x、beautifulsoup、yelp

我试图从Yelp提取餐馆的地址和邮政编码，但没有成功。遇到的问题是，我无法提取包含邮政编码的第二个标签。下面的代码返回地址，而不是邮政编码，但在下面的图像中包含两个线程标记，第一个包含地址，第二个包含邮政和城市。from bs4 import BeautifulSoup url = 'https://www.yelp.com/search?cflt=restau

浏览 2提问于2020-08-28得票数 0

回答已采纳

3回答

HTML标记之间的Selenium

python、selenium、screen-scraping、beautifulsoup

将Javascript创建的页面中的所有超文本标记语言传递给BeautifulSoup的最佳方法是什么？我目前使用的是：from selenium.common.exceptions import NoSuchElementExceptionfrom selenium.webdriver.common.keys import Keys browser =web

浏览 1提问于2012-10-13得票数 2

2回答

如何从html文件中提取地址

python、html

我正在做一个从html文件中确定地址的项目。我想使用python来处理整个html文件。有人能解释一下如何在python中做到这一点吗？提前谢谢你。

浏览 6提问于2021-12-06得票数 0

2回答

使用Python从各种HTML中提取文本

python、regex、beautifulsoup、lxml

假设您有一个多样化的HTML块，如下所示： <div class="sub-container"> <div class="sub-container"> </div> &

浏览 2提问于2018-06-29得票数 0

回答已采纳

0回答

选择带有多个css的html标签

beautifulsoup

我使用BeautifulSoup从html中提取标签。有一些具有多个css类的html标签示例： <a class ='a-link-normal s-access-detail-page s-color-twister-title-link='s-access-detail-page s-color-twister-title-link

浏览 9提问于2018-07-18得票数 0

3回答

如何提取带有标签的标签内的文本？

python、beautifulsoup

我想使用beautifulsoup解析html页面。我希望在不删除html标签的情况下提取标签中的文本。Router link not working</b>样本输出：我试过这样做： from bs4 import Beautifulsoup

浏览 10提问于2019-10-11得票数 2

回答已采纳

1回答

使用python中的美观汤提取网页中数据丰富的节点

python、python-2.7、tags、web-scraping、beautifulsoup

使用python中的美丽汤提取网页中数据丰富的节点，有没有方法计算页面中标签的频率，from bs4 import BeautifulSoup r = requests.get(url) 现在我想数一数所获得的html中所有标签<

浏览 0提问于2015-04-21得票数 2

回答已采纳

2回答

如何从html文件中删除所有不必要的标签和符号？

python、html、parsing、beautifulsoup、xbrl

我正在尝试使用Python的BeautifulSoup或HTMLParser从美国证券交易委员会的EDGAR系统上的10-K报告(例如公司的代理报告)中提取“唯一”文本信息。然而，我使用的解析器似乎不能很好地处理‘txt’格式的文件，包括很大一部分毫无意义的符号和标签以及一些xbrl信息，这些信息根本不是必需的。= BeautifulSoup(html.read()) bs_html_text = bs_html.g

浏览 2提问于2017-05-09得票数 2

1回答

用Python2.7x从href标记中提取字符串

python、regex、python-2.7、beautifulsoup

我目前正在使用Beautifulsoup4从HTML页面中提取href标签。我在Beautifulsoup4中使用的是Beautifulsoup4查询，它运行良好，并返回我正在寻找的'a href‘标记。返回内容的示例如下： "<a href="manage/foldercontent.html?"<a href="manage

浏览 3提问于2015-06-30得票数 0

回答已采纳

1回答

使用python保存Google教程的脱机副本。

python、python-2.7、beautifulsoup

我的问题是，目前整个程序似乎很麻烦。你能提出改进的方法吗？对于ex，我喜欢避免使用Re并使用BeautifulSoup提取‘gc’类下的链接。从BeautifulSoup导入urllib导入re * import os #将从url = '‘html = urllib.urlopen( URL ).read() .read()urllib

浏览 6提问于2014-10-07得票数 1

1回答

如何从用户定义的标记中获取href标记

python、beautifulsoup、goose

可以帮我从获取所有的href标签吗我将这个url加载到goose，并将html内容加载到Beautifulsoup。检查html标签，发现所有的href标签都在'datastore‘中，这是一个自定义标签。我们怎样才能从美丽的汤中提取出hrefs呢？article = g.extract(url='https://www.cnoocltd.com/col/

浏览 1提问于2019-08-10得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云