首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python爬虫实践——零基础快速入门(一)

一、环境配置1.下载安装python3

为什么使用pyhton3,理由如下:

python2以上只维护到2020年,我猜,感觉快要过气了。

没有恶心的编码问题,并且更多工具选择pyhton3,新的工具才是生产力。

本文都用python3来写。如果你是pyhton2,尝试一下pyhton3,相信你会有不一样的体验。

注意选择适合自己电脑的版本。

2.安装requests和lxml。

为啥用pip,因为我们在安装python3的时候,选择了同时安装pip等一系列的包,不想pyhton2,还要一个一个去安装。

pip install requests

pip install lxml

由于我这里已经安装过了,所以显示已经有了。安装的时候请耐心等待哦。

3.安装eclipse或者其他你喜欢的编辑器。

如果不太熟的可以看一下我另一篇python+Eclipse+pydev环境搭建

如果有人恰好跟我一样使用eclipse,那注意配置一下python路径。

windows——>preferences——>General——>Pydev——>Pyhton Interpreter

这里首选python3.6哦。

二、轻松爬取百度网页。

输出结果:

四行代码,我们就可以把百度首页的内容爬取下来:

1.导入requests库

2.下载百度首页内容

3.更改编码方式

4.打印内容

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180225G07CR100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券