上面的博客把基本的HTML解析库已经说完了,这次我们来给予几个实战的项目。
这次主要用Requests库+正则表达式来解析HTML。
项目一:爬取猫眼电影TOP100信息
代码地址:https://gitee.com/dwyui/maoyan-Requests.git
项目二:美食爬取(包含多层爬取)
代码地址:https://gitee.com/dwyui/meishi_Requests.git
最近搞了一个个人公众号,会每天更新一篇原创博文,java,python,自然语言处理相关的知识有兴趣的小伙伴可以关注一下。