xpath - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签xpath

#xpath

为什么你的爬虫跑着跑着内存就爆了？BeautifulSoup、Lxml与XPath的性能生死局

jackcode 25天前2026-06-02 13:40:10

作为长期在数据采集一线摸爬滚打的爬虫党，我经常在私信里收到类似的求助：“为什么我的爬虫刚启动时速度飞快，跑个几小时内存就从 200MB 飙到好几个G，最后直接被...

18210

selenium:动态表格找到xpath

软件测试大叔 2026-04-222026-04-22 15:43:58

新建对象后，查询页面为动态表格，通常tr[ID]是动态的，这里是按名字找到所在行，拼写xpath

8000

18K+标星！视觉AI驱动的浏览器自动化，告别XPath，无惧网页改版！

开源星探 2026-03-162026-03-16 20:32:26

不过最近我发现一款完全不走传统 XPath/DOM 路子的开源自动化工具 — Skyvern。在Github直接斩获18K+星星。

64610

解析规则交给 AI，是效率提升还是系统隐患？

jackcode 2026-01-262026-01-26 16:43:34

理由听起来很诱人： HTML 结构复杂、页面频繁改版、人工维护 XPath 成本高，而大模型“看一眼页面就能写规则”。

16410

爬虫真的能“自愈”吗？说点不那么好听的实话

jackcode 2026-01-052026-01-05 10:32:48

让模型生成 XPath、CSS selector，看 demo 没问题。一到生产环境你就会发现：

20610

不写规则也能抽数据？

jackcode 2025-12-252025-12-25 14:31:05

“15-25K”“20K·14薪”“年薪 30-50 万”这些描述，如何统一量化？

33510

AI 为什么能比你更懂网页？一次关于“语义抽取”的实战实验

jackcode 2025-12-012025-12-01 13:41:06

好不容易把一个站点的结构理清楚，整理了好几行 XPath 或 CSS Selector，终于把标题、评分、评论都抽出来了。但没高兴几天，网页改版了。

39810

【自动化测试篇 | Python】Selenium安装及八大元素定位方法

XPcode7 2025-10-232025-10-23 13:24:35

Selenium是一个非常流行的自动化测试工具，它支持多种编程语言，如Python、Java等，用于自动化Web应用的测试过程。在使用Selenium进行自动化...

1K10

超越传统XPath：用LLM理解复杂网页信息

jackcode 2025-09-112025-09-11 11:24:10

在互联网信息处理领域，传统做法通常依赖 XPath 或 CSS 选择器来定位网页中的标签和节点，从而完成信息抽取。但随着前端框架（React、Vue、Angu...

52410

Python爬虫XPath实战：电商商品ID的精准抓取策略

小白学大数据 2025-08-182025-08-18 16:47:37

1. 引言在电商数据爬取过程中，商品ID（Product ID）是最关键的字段之一，它通常用于唯一标识商品，并可用于构建商品详情页URL、价格监控、库存查询等场...

88810

Python爬虫案例：Scrapy+XPath解析当当网网页结构

小白学大数据 2025-07-242025-07-24 16:43:00

在当今大数据时代，网络爬虫已成为获取互联网信息的重要工具。作为Python生态中最强大的爬虫框架之一，Scrapy凭借其高性能、易扩展的特性受到开发者广泛青睐。...

49700

SelectorsHub - 一款免费的下一代XPath和CSS选择器插件

wangmcn 2025-06-302025-06-30 10:59:05

在Web开发与自动化测试领域，高效定位网页元素是关键环节，而XPath和CSS选择器作为主流定位工具，其编写效率与准确性直接影响开发和测试流程。

2.6K10

【java报错已解决】javax.xml.xpath.XPathExpressionException

鸽芷咕 2025-05-292025-05-29 15:05:19

在Java开发过程中，XML处理是一个常见的任务，而javax.xml.xpath.XPathExpressionException则是在处理XML时可能会遇到...

46510

XPath 语法

jack.yang 2025-04-052025-04-05 15:49:51

We will use the following XML document in the examples below. 我们将在接下来的案例中引用下面这个...

74910

爬取豆瓣Top250 - 2

码农GT038527 2024-11-112024-11-11 08:10:12

50520

【Python爬虫实战】XPath与lxml实现高效XML/HTML数据解析

易辰君 2024-11-072024-11-07 22:22:23

在数据处理和 Web 抓取领域，快速、精准地解析和提取信息至关重要。XPath 和 lxml 是两个用于处理 XML 和 HTML 数据的强大工具。XPath ...

1.7K10

xpath 爬取北京公交相关数据

码农GT038527 2024-09-162024-09-16 15:28:58

此程序使用xpath爬取北京公交路线信息，并且最终将数据存入mysql，爬取时间大概在12分钟左右

54920

【Java】已解决：javax.xml.xpath.XPathExpressionException

屿小夏 2024-09-112024-09-11 15:46:02

在Java开发中，javax.xml.xpath.XPathExpressionException是一种常见的异常，尤其是在处理XML文档时。该异常通常与XPa...

1.2K10

利用Selenium和XPath抓取JavaScript动态加载内容的实践案例

小白学大数据 2024-08-262024-08-26 16:29:29

在当今的互联网时代，数据的获取和分析对于商业决策、市场研究以及个人兴趣都至关重要。然而，许多现代网站采用JavaScript动态加载技术来展示内容，这给传统的静...

2.2K10

#xpath

为什么你的爬虫跑着跑着内存就爆了？BeautifulSoup、Lxml与XPath的性能生死局

selenium:动态表格找到xpath

18K+标星！视觉AI驱动的浏览器自动化，告别XPath，无惧网页改版！

解析规则交给 AI，是效率提升还是系统隐患？

爬虫真的能“自愈”吗？说点不那么好听的实话

不写规则也能抽数据？

AI 为什么能比你更懂网页？一次关于“语义抽取”的实战实验

【自动化测试篇 | Python】Selenium安装及八大元素定位方法

超越传统XPath：用LLM理解复杂网页信息

Python爬虫XPath实战：电商商品ID的精准抓取策略

Python爬虫案例：Scrapy+XPath解析当当网网页结构

SelectorsHub - 一款免费的下一代XPath和CSS选择器插件

【java报错已解决】javax.xml.xpath.XPathExpressionException

XPath 语法

爬取豆瓣Top250 - 2

【Python爬虫实战】XPath与lxml实现高效XML/HTML数据解析

xpath 爬取北京公交相关数据

【Java】已解决：javax.xml.xpath.XPathExpressionException

利用Selenium和XPath抓取JavaScript动态加载内容的实践案例

热门专栏

ATYUN订阅号

小詹同学

腾讯云智能·AI公有云

python3

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐