集合是一种无序、可变的数据结构,它也是一种变量类型,集合用于存储唯一的元素。集合中的元素不能重复,并且没有固定的顺序。在Python 提供了内置的set类型来表示集合,所以关键字set就是集合的意思。
你可以使用大括号{}或者set()函数来创建一个集合。
my_set = {1, 2, 3} # 使用大括号创建集合
print(my_set) # 输出: {1, 2, 3}
my_set = set([1, 2, 3]) # 使用 set() 函数创建集合
print(my_set) # 输出: {1,2, 3}
需要注意的是,集合是无序的,没有固定的顺序。因此,集合元素的顺序可能与你创建或添加的顺序不同。
集合具有以下特点:
集合中的元素是唯一的,不重复。如果重复相同的元素,集合将自动去重。
集合是无序的,没有固定的顺序。因此,你无法像列表或元组那样索引来访问集合中的元素。
集合是可迭代的,你可以使用for循环遍历集合中的元素。
集合是可变的,你可以添加、删除和修改集合中的元素
创建集合
要使用集合,首先就必须要创建,那么在 Python 中,有哪些创建集合的方式呢?你可以使用以下几种方式创建集合。
1、 使用大括号{}或者set()函数创建一个集合,将元素用逗号隔开:
my_set = {1, 2, 3} # 使用大括号创建集合
print(my_set) # 输出: {1, 2, 3}
my_set = set([1, 2, 3]) # 使用 set() 函数创建集合
print(my_set) # 输出: {1, 2, 3}
注意,如果你使用空的大括号{}来创建一个对象,那么创建的将是一个空字典,而非空集合。因此,你必须使用set()函数来创建一个空集合:
empty_set = set()
print(empty_set) # 输出: set()
2、 使用集合推导式来创建集合。集合推导式的语法类似于列表推导式,只需将中括号[ ]替换为大括号{ }:
my_set = {i for i in range(1, 5)}
print(my_set) # 输出: {1, 2, 3, 4}
3、 将其他可迭代的对象(列表、字符串、元组等)转换为集合,可以使用set()函数来实现:
my_list = [1, 2, 3, 2]
my_set = set(my_list)
print(my_set) # 输出: {1, 2, 3}
my_string = 'hello'
my_set ={my_string}
print(my_set) # 输出: {'h', 'e', 'l', 'o'}
访问集合
由于集合是无序的,没有固定的索引,使用索引访问集合中的元素是不可行的,要访问集合中的元素,你可以使用迭代器或者通过成员运算符来实现。
1、 使用迭代器:通过使用 for 循环遍历集合中的每个元素。
my_set = {1, 2, 3}
for item in my_set:
print(item)
2、 使用成员运算:使用in或者not in运算符来检查元素是否存在于集合中。
my_set = {1, 2, 3}
print(2 in my_set) # 输出: True
print(4 not in my_set) # 输出: True
删除集合
在 Python 中,可以使用del关键字来删除集合:
1、 使用del关键字删除集合变量,删除之后如果再次访问,就会发生错误。
my_set = {1, 2, 3}
del my_set
修改集合元素
创建的集合,我们可以对其中的集合元素进行操作,不仅可以添加元素,还是可以删除其中的元素。
添加集合元素
1、使用add()方法向集合中添加元素。
my_set = {1, 2, 3}
my_set.add(4)
print(my_set) # 输出: {1, 2, 3, 4}
2、使用列表的解包操作添加多个元素。
my_set = {1, 2, 3}
new_elements = [4, 5]
my_set.update(new_elements)
print(my_set) # 输出: {1, 2, 3, 4, 5}
因为集合的元素是唯一的,所以如果添加了重复的元素,那么重复的元素不会被添加到集合中,当然执行的过程并不会发生报错,只是不会被添加进去而已。在使用update()方法时,传入的参数可以是一个集合、列表或者其他可迭代对象。
删除集合元素
1、 使用remove()方法删除指定元素:remove()方法会从集合中删除指定的元素。如果集合中不存在该元素,会引发KeyError异常。
my_set = {1, 2, 3, 4}
my_set.remove(3)
print(my_set) # 输出: {1, 2,4}
my_set.remove(5) # 删除不存在的元素,引发 KeyError 异常
2、 使用discard()方法删除指定元素:discard()方法会从集合中删除指定的元素。如果集合不存在该元素,该不会引发异常而是不进行任何操作。
my_set = {1, 2, 3 4}
my_set.discard(3)
(my_set) # 输出: {1, 2, 4}
my_set.discard(5) # 删除不存在的元素,不会引发异常
3、clear()方法清空集合:clear()方法会清空集合元素。
my_set = {1, 2, 3, 4}
my_set.clear()
print(my_set) # 输出: set()
集合运算:
集合的运算指的是对集合进行一系列操作,包括求并集、交集、差集和对称差集等。这些运算可通过运算符或方法来进行。
并集(Union)
可以使用|运算符或者union()方法来获取两个集合的并集。所谓的并集就是包含set1和set2集合的所有元素。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 | set2 # 使用 | 运算符
# 或者使用 union() 方法
# set3 = set1.union(set2)
print(set3) # 输出: {1, 2, 3, 4, 5}
交集(Intersection)
可以使用&运算符或者intersection()方法来获取两个集合的交集。所谓的交集就是取set1和set2集合的相同元素,没有相同元素的话返回的就是set()。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 & set2 # 使用 & 运算符
# 或者使用 intersection() 方法
# set3 = set1.intersection(set2)
print(set3) # 输出: {3}
差集(Difference)
可以使用-运算符或者difference()方法来获取两个集合的差集。所谓的差集就是set1中独有的元素,如果set1中的元素,在set2中也有,那么就该元素就不能在差集中。如果是set2 - set1,那就是set2中独有的元素。结果为空的返回就是set()。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 - set2 # 使用 - 运算符
# 或者使用 difference() 方法
# set3 = set1.difference(set2)
print(set3) # 输出: {1, 2}
对称差集(Symmetric Difference)
可以使用^运算符或者symmetric_difference()方法来获取两个集合的对称差集。所谓的对称差集就是set1和set2中相同的元素剔除,剩下的元素就是对称差集。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 ^ set2 #使用 ^ 运算符
# 或者使用 symmetric_difference() 方法
# set3 = set1.symmetric_difference(set2)
print(set3) # 输出: {1, 2, 4, 5}
需要注意的是,在使用集合运算符时,两个集合的元素类型必须一致。另外,集合的元素是唯一的,不会出现重复。
除了运算符外,还有其他一些常用的集合方法,比如intersection_update()方法用于在原集合上更新为两个集合的交集,difference_update()方法用于在原集合上更新为两个集合的差集,symmetric_difference_update()方法用于在原集合上更新为两个集合的对称差集。
集合的相关函数
Python中的集合也有不少相关的方法,以下就是列举了集合中常用的方法,如有错误的地方欢迎指出。
领取专属 10元无门槛券
私享最新 技术干货