最近要学习爬虫技术,用 python 是最好的选择。
上周末花了一天时间把 python 入门经典书——python 简明教程看完。
我想把一些觉得值得记录注意的的记下来。
Python 语言是极少数能够同时兼容简单与功能强大的编程语言。
基础
三引号
多行注释
跨多行字符串
多行字符串也可以用'\'来连接
输出的格式化方法
format 方法
格式符
缩进
python 对缩进格式很严格,缩进不同层次则不同。
一般写循环、函数也与 C/JAVA 不同,按缩进来对应不同的层次。
缩进用或来表示。
控制流
控制流语句有
注意需要在逻辑行的末尾加上 ":"
可以看出按缩进量来看逻辑结构。
函数
通过关键词 来定义
global 语句
结果为
global 语句用以声明 x 是一个全局变量
关键字参数
这是 python 比较神奇的玩法
结果为
函数的参数可以不一定要按顺序赋予,可以根据关键字来指定值。
可变参数
可以让函数有任意数量的变量,通过星号来实现
结果为
当我们声明一个的星号参数时,从此处开始直到结束的所有位置参数都将被收集并汇集成一个称为 "param" 的元组
类似地,当我们声明一个的双星号参数时,从此处开始直至结束的所有关键参数都将收集并汇集成一个名为 "param" 的字典
DocStrings
不得不说这个真是一个优秀的功能。让我们看看怎么回事!
输出为
首先要求是函数的第一行逻辑行的字符串开始。(也可以是模块或类)
利用'''三引号来规定
可以通过函数来获取文档字符串
通过这种方式,当我们引用别人的包,别人的库时,如果不清楚函数的使用,可以通过提供者自己写的文档字符串,快速查看说明使用。
这样真的太太太方便了!!
模块
python 的模块真的太多太多,太方便了。什么什么爬虫,数据分析,可视化,机器学习用 python 语言学习很方便,就是因为 python 的模块化,让我们其他用户可以互相引用。
而且竟然还可以使用 C 语言来撰写 Python 模块,在编译后,可以通过标准 Python 解释器在自己的项目中使用它
模块的种类
内置模块
第三方模块
自定义模块
模块的引用
模块的__name__
每个模块都有自己的名称
而在当前运行的 py 的__name__默认为__main__
自然就引出我们平常开发时,调用函数时,得加多一句
当我们写一个模块时,而且为了测试而调用模块下的函数。这时候这个模块有调用函数语句。
当我们在一个 py 文件要调用这个模块时,这时候我们的 py 文件就会自动执行该模块的调用语句。
那就很麻烦了,因为我们的目的仅仅是为了引入该模块的方法。
所以为了开发的方便性,我们每次开发项目时,遇到调用方法时,加多以上的 if 语句,这样可以不断方便被调用。
包
包其实就是很多个模块(py 文件)组成的。
一个包含模块与一个特殊的文件的文件夹
数据结构
序列
序列的三种形态——列表、元组、字符串
列表
列表用于保存一系列有序项目的集合。类似于购买清单,每件物品都单独列一行,且按逗号隔开。
列表用方括号括起来,一旦创建了,可以添加、移除、搜索列表中的项目。
输出为
元组
用括号来定义,用于将多个对象保存到一起。
元组不能被编辑或更改。
相当于不变的列表。
字典
python 用的比较多的数据类型。它就像 JSON 数组。
字典就是一个地址簿,知道姓名就可以找到其地址。分为(唯一)与,一一对应。
输出为
集合
集合是简单对象的无序集合,当集合中的项目存在比次序或出现次数重要时,我们就会用集合。
输出为
还有其他的语法之类的,需要在实践中熟练掌握!
not end
-python 学习笔记 -
领取专属 10元无门槛券
私享最新 技术干货