首页
学习
活动
专区
工具
TVP
发布

keinYe

专栏作者
53
文章
67282
阅读量
16
订阅数
Python 爬虫第二篇(urllib+BeautifulSoup)
在前面一篇「Python 爬虫第一篇(urllib+regex)」 我们使用正则表达式来实现了网页输入的提取,但是网页内容的提取使用正则是比较麻烦的,今天介绍一种更简便的方法,那就是使用 BeautifulSoup 网页解析库来实现同样的功能。BeautifulSoup 的安装和用法可以参考「Python 爬虫之网页解析库 BeautifulSoup」这篇文章。
keinYe
2019-08-01
5150
Python 爬虫第一篇(urllib+regex)
爬虫的主要用途即从网站上获取网页,并将网页中的有用信息解析出来。从网站上获取网页内容可以通过 python 内置的 urllib 模块来实现,至于信息的解析说起来比较复杂,python 中可以使用的模块也有很多,今天我们主要使用正则表达式「python 内置的 re 模块」来实现数据的解析。
keinYe
2019-08-01
6700
外行学 Python 爬虫 第八篇 功能优化
在前一篇中讲了如何开启多线程来加快爬虫的爬取速度,本节主要对爬虫爬取内容机型优化,将生产商信息单独独立出来作为一张数据库表,不再仅仅是存储一个生产商的名称,同时保存了生产商的网址和介绍。
keinYe
2019-08-01
5000
Python 正则表达式
在开始之前我们先要明白两个问题。 1、什么是正则表达式? 2、为什么要学习正则表达式? 人类在做一件事之前,总是会先问一下为什么要这么做『你可能说你没有这么想过,我想说的是其实你下意识已经考虑过了』。其实问为什么的时候,既是给我们做这件事的原因,也是我们遇到困难时坚持下去的动力。
keinYe
2019-08-01
6730
Python 爬虫学习一
简单来说网络爬虫就是自动索引互联网上信息的一段程序,看起来像是一个搜索引擎「实际上网络爬虫就是搜索引擎的重要组成部分」,对于我们不做搜索引擎的人来说又为什么来学习爬虫呢,对于我来说很简单,就是想要通过学习爬虫的过程来巩固 python 的知识,通过爬虫我们可以学到什么知识呢?我们可以学到网络编程、数据分析、数据存储。分别对应了爬虫的三个主要功能抓取、分析、存储。
keinYe
2019-08-01
3400
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档