我在做爬虫申请。我希望爬行网站,并找到深度的网页检索。我读过不同的爬行和解析工具,但都没有用。它们似乎都没有为计算深度提供支持。我也不确定使用哪一种爬虫工具,哪种工具最接近所需的功能。任何帮助都是非常感谢的。
提供三端 SDK 、云 API、控制台等多种上传方式,弱网环境下文件上传成功率达到 99.5%
发布于 2014-06-25 11:33:39
最重要的可能是域的映射(而不是解析器)。
因为,如果您使用的是树(有关维基百科的更多信息),那么很容易计算您的URL的深度(最小深度)。
希望这能有所帮助。
https://stackoverflow.com/questions/24416214
相似问题
领取专属 10元无门槛券
AI混元助手 在线答疑
洞察 腾讯核心技术
剖析业界实践案例