使用lxml、xpath和css选择器的Python脚本也返回空列表

使用lxml、xpath和css选择器的Python脚本返回空列表可能是由于以下几种原因：

数据源问题：首先需要确认脚本所使用的数据源是否正确，包括URL地址、文件路径等。如果数据源有误或者数据源中没有需要提取的数据，就会导致返回空列表。
网页结构变化：如果脚本所处理的网页结构发生了变化，例如标签名、属性名等发生了改变，就会导致选择器无法匹配到相应的数据，进而返回空列表。在这种情况下，需要更新选择器以适应新的网页结构。
选择器错误：可能是选择器表达式本身存在问题，导致无法匹配到需要的数据。可以通过检查选择器表达式是否正确，并尝试修改来解决问题。
数据提取逻辑问题：脚本的数据提取逻辑可能存在问题，导致无法正确提取数据。可以通过检查脚本的提取逻辑、调试输出等方式来定位问题所在。

为解决这个问题，可以按照以下步骤逐步排查和调试：

确认数据源的正确性：检查脚本中使用的数据源，确保其有效并且包含需要提取的数据。
检查选择器表达式：检查使用的选择器表达式，确保其正确地匹配到需要提取的数据。
打印调试信息：在脚本中加入调试输出，输出中间结果以确认数据提取逻辑是否正确。
使用不同的选择器：尝试使用不同的选择器，例如使用xpath或者css选择器来替代lxml选择器，以验证是否是选择器本身的问题。
检查网页结构变化：检查网页的结构是否发生了变化，如果是，则需要更新选择器以适应新的网页结构。

如果以上步骤都无法解决问题，可以考虑寻求进一步的帮助，例如查阅相关文档、咨询开发者社区等。对于Python爬虫相关的问题，也可以考虑使用第三方库，例如BeautifulSoup等。

页面内容是否对你有帮助？

有帮助

没帮助

使用lxml、xpath和css选择器的Python脚本也返回空列表

、、、、

我尝试使用带有lxml的xpath从html标记中删除下一个页面的href链接。但是xpath返回的是null列表，而它是单独测试的，而且看起来还行得通。我尝试过css选择器和xpath，它们都返回空列表。代码返回一个空值，而xpath似乎工作得很好。import sysimport urllib.r

浏览 20提问于2019-02-16得票数 2

2回答

面临从表中获取数据的问题

、、、

用python编写一个脚本从表中获取数据，当我使用xpath时，我根据它的行格式和列格式获取数据。然而，当我使用css选择器时，我得到了一个错误'list‘对象没有属性'text’。如何绕过这一点？使用工作正常的xpath：from lxml import html url="https:/

浏览 4提问于2017-07-22得票数 0

回答已采纳

2回答

Clojure等同于Python的lxml库吗？

、、、

我正在寻找与Python的lxml库等效的Clojure/Java。我过去曾大量使用它来解析各种html (作为BeautifulSoup的替代品)，而且能够使用同样的elementtree api for xml也很棒--真的是一个值得信赖的朋友！关于lxml lxml是一个基于libxml2的xml和html处理库。它可以很好地处理

浏览 2提问于2009-10-14得票数 10

回答已采纳

1回答

在刮刮中使用response.css时，需要使用数字部分

、

需要从"“页面获取产品名称和价格。我知道产品的名称，但没有得到价格。item["Product_Name"] = response.css("#product_name::text").extract()[0]所以输出应该是:产品名称:高丽KLE40DLBH1 39英寸高清准备好的LED电

浏览 4提问于2016-12-15得票数 0

回答已采纳

1回答

在使用CSS选择器查找某些<div>标记时遇到困难

、、、

我试图从一个网站抓取信息使用CSS选择器，以获得特定的文本元素，但遇到了一个问题。我试图搜索我想要的网站部分，但我的程序告诉我它不存在。我的程序返回一个空列表。我正在使用request和lxml库，并使用CSS选择器来进行HTML抓取。我有Python 3.7。我试着用选择器搜索我需要的网站部

浏览 0提问于2019-01-22得票数 1

2回答

无法解析来自不同表的`th`标签和`td`标签的数据

、、、、

我用Python语言编写了一个脚本，使用xpath解析网页中的表格数据。在执行时，它能够完美地解析表中的数据。我唯一不能修复的就是解析表示th标签的table header。如果我使用css选择器做同样的事情，我可以使用.cssselect("th,td")，但是在xpath的情况下，我被卡住了。任何关于我如

浏览 11提问于2017-12-24得票数 2

回答已采纳

2回答

使用lxml的Python脚本，返回空列表的xpath

、、、

我尝试使用带有lxml的xpath删除html标记中的href链接。但是xpath返回的是null列表，而它是单独测试的，而且看起来还行得通。代码返回一个空值，而xpath似乎工作得很好。page = self.opener.open(link).read()ref = doc.xpath('//ul[@

浏览 24提问于2019-02-14得票数 0

回答已采纳

1回答

用Python和lxml.html解析Html

、、、

我正在scraperwiki.com上创建一个Python刮板。我需要解析包含以下代码的html页面的一部分： <h3>I'm a title.解析我”的标题。我就是这样做的：import lxml.htmlimport datetimeraw_string= lxml</e

浏览 1提问于2012-10-25得票数 3

回答已采纳

3回答

Python有像LINQ to XML这样的东西吗

我需要解析XML文件并将结果放在HTML表单上，但我是Python新手。Python2.7有没有像C#的LINQ to XML这样的东西，或者有什么好的XML库可以推荐给我？

浏览 1提问于2011-05-25得票数 1

回答已采纳

1回答

如何使用选择器找到特定的文本？

、、、、

我在python中编写了一个脚本来查找td标记中的文本，这是第一个td标记的next sibling，它使用BeautifulSoup和css选择器相结合。如果我运行这个脚本，我会发现它很有用。但是，当我使用lxml库进行同样的操作时，它就不再工作了。如何使我的后一个脚本工作？谢谢。.text结果： Traceback

浏览 3提问于2017-11-03得票数 0

回答已采纳

1回答

不能点击在ui中作为按钮的图像元素？

、、

我是一名使用python的newbee to selenium webdriver，下面是配置： Python Version : Python 2.7我曾尝试通过我的脚本中的xpath和css选择器

浏览 1提问于2014-03-21得票数 0

1回答

使用Python中的美观汤从元素中获取文本值

、

我正在制作python脚本，它从在线站点获取文本数据。这是一个简单的web抓取脚本，语言只是python。我不使用硒，只使用漂亮的汤。而且我可以从<p>或<div>，甚至<h>和<a>中抓取文本，但是当我试图从<td>获取文本时，代码不起作用。下面我分享了我的代码。from threading import Thread from bs4 i

浏览 5提问于2021-07-16得票数 1

回答已采纳

1回答

使用xpath支持的刮取框架

、、

我在找一个网络抓取框架让我有什么建议吗？我见过许多允许我使用xpath进行搜索的方法，但是没有一个能真正为元素生成xpath。

浏览 2提问于2015-06-29得票数 1

回答已采纳

1回答

driver.find_elements()返回空列表

、、、

目前正在通过python和selenium开发爬虫，目标是。 class_name定位元素由于某种原因返回空列表，但对1或2个其他元素有效。我尝试过使用XPath和选择器，但仍然返回空列表。尝试使用父class_names，但也不起作用。

浏览 6提问于2022-10-08得票数 0

3回答

将选择更新数据点从外部网页保存到文本文件

、、

我试图从一个不属于我的网站上获取更新天气数据，并每隔30分钟将其中的一部分放入一个通用的文本文件中。文本文件不应包含任何html标记或任何内容，但可以用逗号、句点或制表符分隔。生成数据的网站将数据放在一个没有class或id的表中。我需要的是从一个标签和它的每个单独的标签内的文本。无论更新的数据是什么，标记每次都在同一行号上。这似乎是一个有点愚蠢的挑战，因为获取数据的方法似乎并不理

浏览 0提问于2011-08-31得票数 1

2回答

Scrapy对XPath的翻译是否与Python的lxml模块不同？

、、、

我试图抓取一个网站，但是我在Scrapy的响应对象上使用的Xpath表达式有问题。第一种方法是使用Python的lxml.html模块打开文件，并将其作为HTMLParser对象加载。第二种方法是<e

浏览 0提问于2020-07-18得票数 0

回答已采纳

2回答

在Scrapy中有没有比XPath选择器更好的选择？

、、、

像title said一样，在Scrapy中有没有更好的XPath选择器，可以用来轻松地选择html中的数据？我发现XPath有很高的学习曲线，它的语法有点难以使用。我觉得如果jQuery选择器可以在Scrapy中使用或合并，它可以让生活变得更容易。

浏览 0提问于2014-12-17得票数 0

4回答

Python库能做类似jQuery的文本提取吗？

、、、

</div>$('.entry a[rel=bookmark]').text()from BeautifulSoup import BeautifulSouprawsoup.findAll('div', 'entry'): print soup.select(e

浏览 1提问于2010-12-13得票数 10

回答已采纳

2回答

使用lxml获取特定元素属性

、、

" value="/hawtio" /><property name="resourceBase" value="${activemq.home}/webapps/hawtio" /> 我还需要在不使用索引的情况下这样做，我需要使用xpath。这意味着，我希望使用xpath访问特定的元素，并在不使用</

浏览 2提问于2021-08-05得票数 0

回答已采纳

2回答

在scrapy和xpath中使用布尔()和count()之类的函数

、、、

因此，我试图使用xpath函数boolean()并使用scrapy提取真正的false响应，但是所有的scrapy返回都是u'0'。不管它是返回布尔值真还是布尔值:false scrapy总是返回基本上这是我的xpath 布尔值(.

浏览 13提问于2017-07-19得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用lxml、xpath和css选择器的Python脚本也返回空列表

相关·内容

使用lxml、xpath和css选择器的Python脚本也返回空列表

面临从表中获取数据的问题

Clojure等同于Python的lxml库吗？

在刮刮中使用response.css时，需要使用数字部分

在使用CSS选择器查找某些<div>标记时遇到困难

无法解析来自不同表的`th`标签和`td`标签的数据

使用lxml的Python脚本，返回空列表的xpath

用Python和lxml.html解析Html

Python有像LINQ to XML这样的东西吗

如何使用选择器找到特定的文本？

不能点击在ui中作为按钮的图像元素？

使用Python中的美观汤从元素中获取文本值

使用xpath支持的刮取框架

driver.find_elements()返回空列表

将选择更新数据点从外部网页保存到文本文件

Scrapy对XPath的翻译是否与Python的lxml模块不同？

在Scrapy中有没有比XPath选择器更好的选择？

Python库能做类似jQuery的文本提取吗？

使用lxml获取特定元素属性

在scrapy和xpath中使用布尔()和count()之类的函数

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐