我不太想写我自己的,但是我现在真的没有足够的时间。我看过维基百科上的open source crawlers列表,但我更喜欢用Python语言写的东西。我意识到我可能只需要使用Wikipedia页面上的工具之一,并将其包装在Python中。我可能最终会这么做--如果任何人对这些工具有任何建议,我都乐于倾听。我通过Heritrix的web界面使用过它,我发现它相当笨拙。我肯定不会为我即将到来的项目使用浏览器API。
提前谢谢。另外,这也是我的第一个问题!
https://stackoverflow.com/questions/419235
复制相似问题