Python Web抓取:如何根据最后一个标记中的内容检索“href”_Python web抓取:获取li、span标记中的内容_如何根据python中的两个类别来获取列的最后一个值？ - 腾讯云开发者社区

python、xml、beautifulsoup

<td valign="top" align="left"><a href="/Archives/edgar/data/1696969/000169696919000025/0001696969-19="/Archives/edgar/data/1696969/000169696919000025/0001696969-19-000025.txt">[text]&l

浏览 30提问于2020-01-29得票数 0

1回答

用Python和Selenium从标记中获取文本

python、selenium、selenium-webdriver、web-scraping、xpath

我一直试图用Python和Selenium抓取一个网页，结果遇到了这个问题。基本上，我正在抓取的网页在带有分页的表中显示信息，所以我想从所有页面中获取信息。当我在一个不是最后一页的页面(本例中为第2页)时，这是分页系统的HTML： " [" <a

浏览 4提问于2022-11-10得票数 1

回答已采纳

3回答

用python刮网站

python、web-scraping、beautifulsoup、scrapy、libraries

我试图在网上刮一个网站，以获取价格和标题从它。我已经看过多个教程和博客，最常见的库是漂亮汤和scrapy。如果有一种方法可以在不使用任何第三方库(如beautifulsoup和scrapy )的情况下抓取一个网站，那么就可以使用beautifulsoup。It can use builtin libraries请推荐我一个博客、文章或教程，这样我就能学到

浏览 1提问于2020-06-09得票数 1

回答已采纳

1回答

使用Selenium和Java从网站中抓取数据

selenium、selenium-webdriver

我试图刮数据从板球网站，并已经写了一个方法，接受一个球员的名字，并显示他们的相应数据。如果您看到此方法，则取一个播放机名称并显示其所有数据。我的要求是显示所有球员的完整记分卡，而不是只显示一个球员的数据。

浏览 0提问于2020-03-04得票数 0

2回答

BeautifulSoup web抓取，无结果

python、beautifulsoup、web-crawler

我在试着从https://hk.appledaily.com/search/apple..。我需要从div class="flex-feature"但它只返回[]..。希望大家能帮忙，谢谢！ from bs4 import BeautifulSoup results = soup.find_all(

浏览 40提问于2020-10-06得票数 2

回答已采纳

3回答

获取Google搜索结果和清理HTML标签的建议

python、html、nlp

我正在从事一个项目，以获得谷歌搜索网页，然后清理HTML标签，以获得纯文本内容。非常感谢。

浏览 3提问于2011-03-05得票数 1

回答已采纳

1回答

我想从这份文件中获得特定的网址使用php爬虫

php、html、web-crawler、phpcrawl

我有一个类似下面的网页： <a href="http://unknown-url.com">Unknown Link</a> </li>我想抓取一个页面，里面填满了其他几个我不感兴趣的元素。我只想在锚标记中检索li元素中的<em

浏览 12提问于2016-09-15得票数 0

3回答

“汤”和“美汤”中的“汤”是什么意思？

beautifulsoup、jsoup

“汤”和“美汤”中的“汤”是什么意思，为什么它被称为“汤”？

浏览 1提问于2014-05-19得票数 10

2回答

如何使用Selenium和Python从特定类中提取href信息

python、selenium、xpath、css-selectors、webdriverwait

我目前正在使用python和selenium进行一些web抓取，而且我似乎无法在特定类的锚标记中从href中提取链接信息。作为参考，它来自zillow (具体来说，这个url： )。links = driver.find_elements(By.CLASS_NAME, "list-card-info&qu

浏览 6提问于2022-04-03得票数 1

回答已采纳

1回答

从html页面不显示数据的url读取数据

beautifulsoup、python-3.5

r = s.get(link) print(soup.prettify()) 但是我看不到网页的内容如何提取它们？

浏览 1提问于2020-02-05得票数 0

1回答

按链接显示iframe内容

javascript、html

我有一个iframe在我的页面，我想显示内容根据链接(锚标签)选择。我想用javascript实现这一点。如何检索选择了哪个锚标记。如果我在锚标记中调用onclick()函数中的javascript函数，并且不添加href属性，那么锚标记(link)将失去它的超级链接属性。那么，在本例中<e

浏览 2提问于2012-06-28得票数 0

回答已采纳

2回答

基于标记值的过滤

python、beautifulsoup

因此，我使用BeautifulSoup进行一些web抓取，部分结果如下： ... ... ...三个tr块的所有内容在结构上都是相同的，除了第三个块最后</e

浏览 20提问于2022-01-16得票数 1

1回答

从带有角JS标记(如ng-view )的web获取文本。

python、angularjs、web-scraping、scrapy、screen-scraping

我试图从一个网站上获取所有可见的文本，我使用来完成这项工作。然而，我观察到的scrapy只适用于div、body、head等HTML标记，而不适用于角形js标记(如ng-view )，如果在ng-view标记中有任何元素，当我对页面进行右键单击并执行查看源时，标签内的内容就不会出现，它会显示为<ng-view> </ng-view>，所以我如何使用python预先在这个ng-view

浏览 1提问于2015-06-05得票数 1

1回答

检查NoneType的变量并中断一个while循环

python-3.x、web-scraping、beautifulsoup、href、nonetype

我对编程非常陌生，并且开始教自己用Python进行网络抓取。我正在从一个站点的多个页面中抓取播放器数据，并构建了一个site循环，该循环将一个“next”按钮的href抓取到下一个玩家的页面。一切都进行得很好，除了在最后一个可用的播放器之后中断while循环。“next”-按钮将变成灰色，没有链接，因此我想停止

浏览 2提问于2017-11-15得票数 4

回答已采纳

4回答

使用<a> (在其他两个标记之间)从BeautifulSoup中抓取一系列链接

python、beautifulsoup、screen-scraping

请您帮助我根据这个html代码解决Python中的一个问题：<div><a itemprop="affiliation" href=carId=1207230">Text3</a></div><div> <h2 class="sectionT

浏览 1提问于2018-02-16得票数 1

回答已采纳

1回答

使用C#从网页获取链接

c#、visual-studio

我正在尝试抓取一个网页上的文章链接。这是我的代码：{ string html = web.DownloadString("http://www.dailymirror.lk"); MatchCollection m1 = Regex.Matches(html, @"<a

浏览 0提问于2015-12-17得票数 3

2回答

用regex提取Python* url数据*

python、regex、replace

我想从Python标记中检索内容和href链接。我是regex的初学者，能够以这种方式检索href内容：在尝试提取标签的内容时，我什么也得不到。 urls = re.find

浏览 3提问于2015-12-29得票数 0

回答已采纳

2回答

如何从<select>标记中抓取更改内容的网页

python、web-scraping

我想刮一个通过<select>标记改变其内容的网页。当我选择不同的选项时，页面的内容会动态变化。我想知道是否有一种方法可以从python脚本中更改选项，以便从<select>标记中的所有不同选项的所有不同页面获取内容。

浏览 6提问于2012-09-10得票数 4

2回答

如何在python中抓取分散在多行上的html标签？

python、scripting、web-scraping

我正在尝试用python抓取网页。我可以轻松地获取单行标记的结果，但是对于分布在多行上的标记，我的代码无法检索任何内容。在HTML源代码中，单行标记表示为：和多个行标记表示为： <td

浏览 0提问于2013-02-15得票数 2

回答已采纳

1回答

Python web抓取<a>之间的访问值</a>

python、web-scraping

我是网络刮擦的新手，如果之前有人问过这个问题，很抱歉。假设我有这样的html代码：<a aria-current="page" aria-label="Current page" href="https://name_webpage.com/">1</a>如何使用python访问<a> </a>之间的值，即1？

浏览 2提问于2021-02-18得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云