GROUP BY
,对单节点或协调节点的影响通常都“很大”,尤其在未命中索引、跨分片汇聚、基数高的情况下。1、Sitemap/批量抓取与去重:Crawler MCP(基于 Crawlee/Apify 的 MCP 封装)
2、API/JSON 数据源优先:HTTP Client MCP(请求签名、分页、速率限制)
3、数据落地与管道:Storage MCP(S3/GCS/SQLite/Postgres) + Scheduler MCP(队列/限速/重试)
1、Sitemap/批量抓取与去重:Crawler MCP(基于 Crawlee/Apify 的 MCP 封装)
2、API/JSON 数据源优先:HTTP Client MCP(请求签名、分页、速率限制)
3、数据落地与管道:Storage MCP(S3/GCS/SQLite/Postgres) + Scheduler MCP(队列/限速/重试)
GROUP BY
,对单节点或协调节点的影响通常都“很大”,尤其在未命中索引、跨分片汇聚、基数高的情况下。