11月2日晚上,仙II-115的教室里涌入了一群神秘的马赛克,他们是谁,他们要干什么?哦~原来是天健社技术部的Python内训呀,那么就跟随小编去现场偷师吧!
01
Python简介
“Python”之名来源于作者Guido van Rossum喜欢的名为Monty Python的喜剧团体。与同为科学计算语言的MATLAB相比,具有开源免费的优点。与C、C++、Java等需要编译才能运行的语言相比,Python可以直接通过命令行执行。而且,Python现成的包很多,所以需要C/C++写几百行才能实现的功能可以只通过几行Python代码来实现。因此,Python以简洁、易上手、面向对象、功能强大等优点,在科学计算、机器学习方面应用广泛。
02
基本语法
接下来给大家介绍一下Python的基本语法
首先是数据类型。今天主要给大家介绍数字、布尔、字符串、列表、字典等几种类型。
1.Python中的数字支持整数、浮点和复数,可以进行加减乘除幂和比较运算。
2.布尔类型(bool):
判断真假——True和False。
Eg:0==1 —— False
3.字符串(str):一对单引号与一对双引号完全相同,两个字符串之间可以使用“+”来进行字符串拼接(注意顺序性)。
4.列表(list)
↑教学要点:(详见文末)
1)索引从0开始
2)追加(append)
3)插入(insert)
4)按值删除(remove)
5)按索引弹出(pop)
6)倒数第x个元素
7)判断某元素是否在列表里
5.字典(Dictionary)
接下来是一些会用到的其他语法:
1.注释:在语句之前打“#”即可。
2.赋值:=
3.导入包。
好啦,基本语法我们就介绍到这里,接下来我们就进入正题讲讲用Python做程序吧!期待地搓手手~
03
正式开始
第一行代码我们这样打:
首先我们练习一下条件语句:
所以你们都是小机灵鬼呀!
然后是循环语句(这里只介绍for循环):
嗯!!!(疯狂点头)
接下来是函数:
咋害没开始呢???别急嘛,这些是必须的练习,接下来我们就进入爬虫。
04
爬虫实战
爬虫是按照我们设置的规则,自动抓取网站信息的网络机器人,常用requests库模拟网络请求,BeautifulSoup库来解析网页。
Eg1网络请求:使用Chrome浏览器查看
Network-XHR(XmlHttpRequests)
Eg2网页解析:打开Chrome浏览器,以p.nju.edu.cn为例,修改网页元素。
新司机可以上路啦!我们来爬豆瓣电影榜单,以www.douban.com/doulist/240962/为例:
首先练习抓取网页图片!哼,小孩子才做选择,我~全~都~要~
Stage1
抓取网页上所有图片
• 关键点
• 源代码
大家会发现,这些图片杂乱无章,那么如果我们只想要电影海报怎么操作呢?
Stage2
抓取网页上所有电影海报
• 关键点:
• 源代码:
以上就是本次内训的全部内容,小机灵们学会了没有哇!
爱看电影的你大概会说:“我才不是外貌协会呢!”那么我们想刷一刷影评又该怎么操作呢?
欢迎大家访问天健社的网站http://njutianjian.com/teaching_python.html获取彩蛋——抓取热门电影的热门评论。
(嘤 ~计科学长颜值都这么高吗?)
结语
呼!技术部第一次内训就这样结束啦!Python从入门到爬虫只要一次内训的时间,是不是一颗赛艇呀!
不知道参与的大家是继续一脸懵圈还是燃起了对Python的兴趣呢?如果这次内训给你打开了新世界的大门,那希望下次见面的时候你能完美接住所有bug呀~
领取 专属20元代金券
Get大咖技术交流圈