我找不到任何好的基于Java的web抓取API。我需要抓取的站点也不提供任何API;我想使用一些pageID遍历所有网页,并在它们的DOM树中提取HTML标题/其他内容。
pageID
除了网络抓取之外,还有其他方法吗?
https://stackoverflow.com/questions/3202305
相似问题