前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python爬虫简单案列 三行代码实现第一个爬虫代码

Python爬虫简单案列 三行代码实现第一个爬虫代码

作者头像
梦溪
发布2021-08-05 15:35:26
1.1K0
发布2021-08-05 15:35:26
举报
文章被收录于专栏:梦溪博客梦溪博客

什么是爬虫?

爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息。

工具准备

1.python环境搭建

2.pycharm (编译器)

3.requests

这个案例是以python语言编写的,首先呢,我们需要安装python环境,以及python编译器,目前比较主流、功能比较丰富的编辑器当属pycharm。PyCharm 是一款功能强大的Python 编辑器,PyCharm是一种Python IDE(Integrated Development Environment,集成开发环境),带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外,该IDE提供了一些高级功能,以用于支持Django框架下的专业Web开发。

代码

代码语言:javascript
复制
import requests  # 导入requests
page = requests.get("https://www.baidu.com").text  # 使用requests的get方法得到百度页面的信息
print(page)  # 输入页面内容

python代码

代码讲解

从上图中我们可以看到运行这短短的三行代码就会得到www.baidu.com页面的内容。

为什么呢?

requests是python实现的简单易用的HTTP库,使用起来比urllib简洁很多 因为是第三方库,所以使用前需要cmd安装

代码语言:javascript
复制
pip install requests

安装完成后import一下,正常则说明可以开始使用了。 基本用法: requests.get()用于请求目标网站,类型是一个HTTPresponse类型

我们在编写爬虫的时候首先要import requests,才能调用requests方法

代码语言:javascript
复制
page = requests.get("https://www.baidu.com").text

这行语句是说使用requests的get方法【get(url)】,获取到百度页面的内容然后转化成text格式,并赋值到page

最终由

代码语言:javascript
复制
print(page)

打印出url(百度)的页面内容


版权属于:Cyril 本文链接:https://www.cyrilstudio.top/archives/504/ 转载时须注明出处及本声明

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021 年 07 月,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 什么是爬虫?
  • 工具准备
  • 代码
  • 代码讲解
相关产品与服务
项目管理
CODING 项目管理(CODING Project Management,CODING-PM)工具包含迭代管理、需求管理、任务管理、缺陷管理、文件/wiki 等功能,适用于研发团队进行项目管理或敏捷开发实践。结合敏捷研发理念,帮助您对产品进行迭代规划,让每个迭代中的需求、任务、缺陷无障碍沟通流转, 让项目开发过程风险可控,达到可持续性快速迭代。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档