我在做爬虫申请。我希望爬行网站,并找到深度的网页检索。我读过不同的爬行和解析工具,但都没有用。它们似乎都没有为计算深度提供支持。我也不确定使用哪一种爬虫工具,哪种工具最接近所需的功能。任何帮助都是非常感谢的。
发布于 2014-06-25 19:33:39
最重要的可能是域的映射(而不是解析器)。
因为,如果您使用的是树(有关维基百科的更多信息),那么很容易计算您的URL的深度(最小深度)。
希望这能有所帮助。
https://stackoverflow.com/questions/24416214
复制相似问题