python爬虫集合,函数,元素,字典,删除

【芝麻代理IP】大数据时代下,数据采集推动着数据分析,数据分析推动发展。但是在这个过程中会出现很多问题。拿最简单最基础的爬虫采集数据为例,过程中就会面临,IP被封,爬取受限、违法操作等多种问题,所以在爬取数据之前,一定要了解好预爬网站是否涉及违法操作,找到合适的代理IP访问网站等一系列问题。今天我们要介绍珍藏多年的Python爬虫笔记,大家小本本拿出来哦~

集合{ }:

集合是无序的,且集合中的元素是唯一的 set 集合是一个可变对象

可以使用set()类型转换成集合,set只能传一个对象所以创建时括号内使用元祖或者列表,例如:set([1,2,3,4,5]) 也可以直接定义 集合的运算以及函数

a =

b =

a | b = 获取a和b集合内所有的元素,有重复的去重

a &b = 获取a和b的交集

a - b = 获取a和b的差集,返回的元素以a为准,谁在前面就以谁的集合为准

a.add(’ x ') 将元素x 添加到集合a中

a.pop() 删除a集合中的元素 随机的 注意括号内不加任何参数

a.remove(‘x’) 删除a集合中的x 元素

a.update({‘teacher’,56,45,34})修改a集合 将这些参数增加到a中

函数

isdisjiont()判断两个集合是否没有交集 有返回False 没有交集返回Ture

issubset() 判断前面的集合是否包含于后面的集合 也就是说前面的集合一定比后面的交集元素少

issuperset() 判断前面的集合是否包含后面的集合 也就是说前面的集合一定比后面的交集元素多

字典

dict = {‘Name’: ‘Zara’, ‘Age’: 7, ‘Class’: ‘First’};

修改字典

update.[‘nama’] = ‘zhangren’

复制

a = dict.copy() 浅复制dict 给a 对a进行修改dict的不会变化

创建新字典

b = dict.fromkeys([1,2,3],[7] ) 返回一个键为1,2,3 键值都是7 的字典

dict.setdefault(‘name’,99) 查询dict中键为name的键值,如果没有就创建键为 name 键值为 99 的键值对 有则查无则增 与dict.get() 用法一样

删除

dict.clear() 清楚字典的内容

dict.pop(‘name’) 删除键值为name的元素

dict.popitem() 随机返回删除的一个键值对

dict.keys() 返回键

dict.value 返回键值

dict.items() 以列表返回可遍历的(键, 值) 元组数组 dict_items([(‘Name’, ‘Zara’), (‘Age’, 7), (‘Class’, ‘First’)])

芝麻软件双十一活动火热上线,更多资讯请到官网咨询:http://www.zhimaruanjian.com/

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181111A0VMD500?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券