网络爬虫 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签网络爬虫

#网络爬虫

突发技术信号：开源项目版本监控升温，Release 爬虫成为研发团队新工具

用户12583401 21小时前2026-06-28 13:02:52

开源生态正在变得越来越快。一个 AI 框架、数据库、中间件、前端工具或云原生组件，可能几天就发布一个小版本，几周就更新一次重要功能。对于研发团队来说，真正麻烦的...

2010

网页数据采集不再只是写脚本，工程化爬虫成为关键能力

用户12583401 1天前2026-06-27 14:32:59

很多人第一次写爬虫，通常是从几行 requests.get() 开始的。代码能跑，页面也能拿到，但一旦面对真实网站，例如 news.example.com、do...

6110

Python爬虫进阶：Playwright请求拦截（Request Interception）实战

jackcode 5天前2026-06-23 13:51:21

大家好，在日常的爬虫开发和自动化抓取中，我们经常会遇到一些让人头疼的场景。比如目标网站加载了大量无关的图片和视频拖慢了抓取速度，或者通过检测请求头和前端特征来封...

11310

为什么说掌握了HTTP协议状态码，就解决了50%的爬虫报错

jackcode 19天前2026-06-09 16:27:16

在爬虫圈子里，经常能看到新手在各大技术社区发帖求助：“为什么我的爬虫昨天还好好的，今天就报错了？”、“刚爬了不到百条数据就返回空，是不是被反爬了？”

12610

住宅IP怎么用？手把手教你做广告地域验证（附代码）

辣椒HTTP 20天前2026-06-08 17:50:19

想知道你的广告在纽约、伦敦、东京的真实展示效果？用住宅IP就能模拟当地用户环境，看到最真实的广告版位。本文附带Python代码示例，开头的参考信息供有需要的朋友...

3200

如何优雅地搞定复杂 SPA 爬虫？Playwright异步模式实战踩坑指南

jackcode 25天前2026-06-03 14:05:49

作为一个长期和各种反爬、动态渲染死磕的爬虫程序员，最近常有同行向我吐槽：现在的网站越来越难爬了。尤其是遇到用 React 或 Vue 架构的 SaaS 管理后台...

20410

WorkBuddy 爬虫实战：我用 AI 自动采集小红书数据，零代码搞定（附完整踩坑记录）

用户9939841 2026-05-272026-05-27 16:41:34

最重要的是：零维护成本。传统爬虫脚本过段时间就得修，WorkBuddy 你说一句"网站改版了帮我适配一下"就行。

1K10

为什么我劝你放弃Selenium拥抱Playwright

jackcode 2026-05-272026-05-27 15:55:13

经常有同行或者刚入路的小伙伴在私信里问我：“博主，都2026年了，写爬虫和自动化到底是选 Selenium 还是 Playwright ？”

19910

20 天，2000 用户，Meet Blog 博客星图想链接每一座独立博客

月小水长 2026-05-252026-05-25 23:47:50

2026 年春节得空，我清理了下散落在 Trello 的这个 idea： Meet-Blog 博客星图，并开始着手构建数据集和设计前后端实现，得益于 Vibe ...

14900

怎么用python监控板块资金流向

子晓AI量化 2026-05-202026-05-20 21:20:20

如果不想花钱买积分，你可以选择写网络爬虫抓取同花顺、东方财富、开盘啦等第三方平台数据，也是一种思路。只是同花顺、东方财富本身有限制访问频率，这个得把控好...

77810

通过网络爬虫获取全球指数的技术方案

子晓AI量化 2026-05-132026-05-13 20:35:27

做量化的朋友应该都有过这种体验——每天盯着 A 股，偶尔瞟一眼美股、日经、欧洲三大指数，就怕哪天外盘暴跌，第二天一开盘懵了。

23610

Go爬虫进阶：如何优雅地在Colly框架中实现无缝代理切换？

jackcode 2026-04-282026-04-28 15:36:44

做过规模化采集的同学都知道，当抓取量级上来之后，高频请求极易触发目标站点的限制机制。目前业内主流的破局方案是引入代理池，但这在工程实现上带来了一个核心痛点：如何...

19110

炒股龙虾实操及后续看法

子晓AI量化 2026-04-232026-04-23 20:18:27

既然官方数据源下场了，提供每天限额免费次数（超额以后估计也会提供收费服务），那么网络爬虫以后会不会限制更多，更不稳定。再加上不少人肯定第一反应是折腾网上免费的...

56210

基于CefSharp内核与动态隧道的金融海量行情抓取架构方案

jackcode 2026-04-142026-04-14 15:07:37

在金融量化分析与交易领域，数据的时效性和准确性是核心竞争力。我们的业务团队最近接手了一个需求：需要从某头部海外行情网站实时抓取高频的K线数据和盘口委托单。

19610

#网络爬虫

突发技术信号：开源项目版本监控升温，Release 爬虫成为研发团队新工具

网页数据采集不再只是写脚本，工程化爬虫成为关键能力

Python爬虫进阶：Playwright请求拦截（Request Interception）实战

为什么说掌握了HTTP协议状态码，就解决了50%的爬虫报错

住宅IP怎么用？手把手教你做广告地域验证（附代码）

如何优雅地搞定复杂 SPA 爬虫？Playwright异步模式实战踩坑指南

WorkBuddy 爬虫实战：我用 AI 自动采集小红书数据，零代码搞定（附完整踩坑记录）

为什么我劝你放弃Selenium拥抱Playwright

20 天，2000 用户，Meet Blog 博客星图想链接每一座独立博客

怎么用python监控板块资金流向

通过网络爬虫获取全球指数的技术方案

Go爬虫进阶：如何优雅地在Colly框架中实现无缝代理切换？

炒股龙虾实操及后续看法

基于CefSharp内核与动态隧道的金融海量行情抓取架构方案

热门专栏

新智元

腾讯云智能·AI公有云

Python爬虫与数据挖掘

前端达人

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐