首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Java不适合做爬虫?试试这个工具!

就在逛各种论坛,逛着逛着就想,是不是可以弄个爬虫,把这些网上的信息都下下来,自己有空时慢慢研究来着,也是赶巧,这么想的时候正好看到一个爬虫项目,用了下感觉还不错,赶紧来和大家分享以下~ 项目的名字很有意思,Spiderman...Spiderman是一款基于Java开源Web数据抽取的工具。 工具的目标就是收集指定的Web页面并从这些页面中提取有用的数据给用户。...Spiderman主要运用了XPath、正则表达式等基础技术来实数据的抽取与分析。...使用的时候其实只要三步: 确认好想要的目标网站以及目标网页,就是你要爬取的数据目标 打开目标页面获取该页面数据的XPath 在xml配置文件里填写好参数,运行Spiderman即可 那有的初来乍到的小伙伴可能要问了

52320
领券