前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【我问Crossin】爬虫学习该如何入门?

【我问Crossin】爬虫学习该如何入门?

作者头像
Crossin先生
发布2018-04-17 14:13:50
7670
发布2018-04-17 14:13:50
举报
1

程序中使用了列表,运行过程中报错: IndexError: list index out of range

这是由于列表的下标索引值超过了列表的总长度。 举例:

代码语言:javascript
复制
>>>l = [1,2]
>>>l[5]
IndexError: list index out of range

为了避免这种情况,可以使用 len() 函数取得列表的总长,再进行索引

代码语言:javascript
复制
if len(l) > 5:
    print(l[5])
2

如何将一个 py 文件打包为 exe 文件?

.py 文件打包为 exe 文件可以使用 cx_freezepy2exePyinstaller 等库可以操作。

我们之前有过一篇用 cx_freeze 打包 pygame 打飞机游戏的文章:将打飞机游戏打包成 exe

cx_freeze 官方文档:http://cx-freeze.readthedocs.io/en/latest/overview.html py2exe 官方文档:http://www.py2exe.org/index.cgi/Tutorial

3

如何入门爬虫学习?

在学习爬虫之前,你至少需要以下基础:

基础的 Python 知识:

  • 基本的数据结构知识:list 、dict 以及对其处理的方法处理爬下来的数据
  • 条件判断(if等):用来解决爬虫过程中哪些要哪些不要的问题
  • 循环和迭代(for while ):用来循环,重复爬虫动作
  • 文件读写操作:用来读取参数、保存爬下来的内容等
  • 函数的基本知识

了解一个或多个跟网络请求相关的库或模块,比如 urllibrequests 等 了解基本的文档树内容,知道基本的 html 标签 了解 beautifulsoup4 的基本用法

然后就可以开始做一些项目了,比如爬豆瓣妹子图等,边学边做,逐渐提高姿势水平。 知乎上有一些关于入门爬虫的好问题,不妨先去了解一下: 如何入门爬虫:https://www.zhihu.com/question/20899988 如何学习python爬虫:https://zhuanlan.zhihu.com/p/21479334 利用爬虫技术能做到哪些很酷很有趣很有用的事情?:https://www.zhihu.com/question/27621722 零基础如何学爬虫基础?:https://www.zhihu.com/question/47883186

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-03-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Crossin的编程教室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1
  • 2
  • 3
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档