技术部内训小本本之Python篇

11月2日晚上,仙II-115的教室里涌入了一群神秘的马赛克,他们是谁,他们要干什么?哦~原来是天健社技术部的Python内训呀,那么就跟随小编去现场偷师吧!

01

Python简介

“Python”之名来源于作者Guido van Rossum喜欢的名为Monty Python的喜剧团体。与同为科学计算语言的MATLAB相比,具有开源免费的优点。与C、C++、Java等需要编译才能运行的语言相比,Python可以直接通过命令行执行。而且,Python现成的包很多,所以需要C/C++写几百行才能实现的功能可以只通过几行Python代码来实现。因此,Python以简洁、易上手、面向对象、功能强大等优点,在科学计算、机器学习方面应用广泛。

02

基本语法

接下来给大家介绍一下Python的基本语法

首先是数据类型。今天主要给大家介绍数字、布尔、字符串、列表、字典等几种类型。

1.Python中的数字支持整数、浮点和复数,可以进行加减乘除幂和比较运算。

2.布尔类型(bool):

判断真假——True和False。

Eg:0==1 —— False

3.字符串(str):一对单引号与一对双引号完全相同,两个字符串之间可以使用“+”来进行字符串拼接(注意顺序性)。

4.列表(list)

↑教学要点:(详见文末)

1)索引从0开始

2)追加(append)

3)插入(insert)

4)按值删除(remove)

5)按索引弹出(pop)

6)倒数第x个元素

7)判断某元素是否在列表里

5.字典(Dictionary)

接下来是一些会用到的其他语法:

1.注释:在语句之前打“#”即可。

2.赋值:=

3.导入包。

好啦,基本语法我们就介绍到这里,接下来我们就进入正题讲讲用Python做程序吧!期待地搓手手~

03

正式开始

第一行代码我们这样打:

首先我们练习一下条件语句

所以你们都是小机灵鬼呀!

然后是循环语句(这里只介绍for循环):

嗯!!!(疯狂点头)

接下来是函数

咋害没开始呢???别急嘛,这些是必须的练习,接下来我们就进入爬虫。

04

爬虫实战

爬虫是按照我们设置的规则,自动抓取网站信息的网络机器人,常用requests库模拟网络请求,BeautifulSoup库来解析网页。

Eg1网络请求:使用Chrome浏览器查看

Network-XHR(XmlHttpRequests)

Eg2网页解析:打开Chrome浏览器,以p.nju.edu.cn为例,修改网页元素。

新司机可以上路啦!我们来爬豆瓣电影榜单,以www.douban.com/doulist/240962/为例:

首先练习抓取网页图片!哼,小孩子才做选择,我~全~都~要~

Stage1

抓取网页上所有图片

• 关键点

• 源代码

大家会发现,这些图片杂乱无章,那么如果我们只想要电影海报怎么操作呢?

Stage2

抓取网页上所有电影海报

• 关键点:

• 源代码:

以上就是本次内训的全部内容,小机灵们学会了没有哇!

爱看电影的你大概会说:“我才不是外貌协会呢!”那么我们想刷一刷影评又该怎么操作呢?

欢迎大家访问天健社的网站http://njutianjian.com/teaching_python.html获取彩蛋——抓取热门电影的热门评论。

(嘤 ~计科学长颜值都这么高吗?)

结语

呼!技术部第一次内训就这样结束啦!Python从入门到爬虫只要一次内训的时间,是不是一颗赛艇呀!

不知道参与的大家是继续一脸懵圈还是燃起了对Python的兴趣呢?如果这次内训给你打开了新世界的大门,那希望下次见面的时候你能完美接住所有bug呀~

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181106B1SC6A00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

同媒体快讯

扫码关注云+社区

领取腾讯云代金券