课程概述

Python是一种清晰且功能强大的、面向对象的编程语言,广泛应用于Web开发、GUI开发、科学计算等领域。

本课程首先介绍了爬虫的概念、应用和分类以及数据的获取方式和数据的作用;然后展示了如何使用Python语言内置的urllib模块实现小型的爬虫程序,并详细讲解了urllib模块的用法,包括发送请求的request、处理异常的error以及处理url的parse等;接着介绍了简单易用的Requests库,包括它的优势和用法;最后讲解了用于数据采集的Scrapy框架和用于数据解析的XPath的用法,以及如何组合使用Selenium和Chrome headless模式来爬取动态网页。

【课程目标】

了解爬虫的概念和作用

使用urllib、Requests、Scrapy等编写网络爬虫程序

【适用对象】

商务、开发、学生、Python爬虫初学者,Python爬虫爱好者

【课程大纲】

知识模块

简介

Python网络爬 虫实战

什么是爬虫、“人工智能时代”如何获取数据、生活中的爬虫、爬到的数据有什么用、 为什么用Python写爬虫、爬虫的分类、利用urllib实现最小的爬虫程序、urllib的基本 用法、人性化的requests、神奇的正则表达式、数据采集神器:Scrapy、数据解析 神器:xpath、动态网页的克星:Selenium和Chromeheadless

机构简介

腾讯产业互联网学堂

腾讯云旗下面向云生态用户的一站式学习成长平台

讲义

什么是爬虫?

爬虫是网络数据采集的程序。爬虫的过程都是由代码定义好的,大量的节省人工的成本,极大的提高数据获取效率。

课程评价(0)

感谢你参加本课程,请你作出评价:
0/300

以下选自学员评价

暂无精选评价