跳到主要内容

Python3 集合

集合(set)是一个无序的不重复元素序列。因此在每次运行的时候集合的运行结果的内容都是相同的,但元素的排列顺序却不是固定的,所以本章中部分案例的运行结果会出现与给出结果不同的情况(运行结果不唯一)。

可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。

创建格式:

parame = {value01,value02,...}
或者
set(value)

集合实例:

basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)  # 这里演示的是去重功能

print('orange' in basket)                 # 快速判断元素是否在集合内
print('crabgrass' in basket)

运行结果:

{'pear', 'banana', 'orange', 'apple'}
True
False

集合的运算:

a = set('abracadabra')
b = set('alacazam')

print(a)
print(b)

print(a-b)

print(a|b)

print(a&b)

print(a^b)

运行结果:

{'b', 'd', 'a', 'c', 'r'}
{'l', 'z', 'm', 'a', 'c'}
{'r', 'd', 'b'}
{'l', 'z', 'b', 'm', 'd', 'a', 'c', 'r'}
{'c', 'a'}
{'l', 'z', 'b', 'm', 'r', 'd'}
a-b(a集合中b没有的元素)bdr
集合abdrac
a\ b(并集)bdraclz
集合baclzm
a&b(交集)ac
a^b(不同时包含于a和b的元素)bdrlzm

类似列表推导式,同样集合支持集合推导式(Set comprehension):

>>> a = {x for x in 'abracadabra' if x not in 'abc'}
>>> a
{'r', 'd'}

集合的基本操作

1、添加元素

语法格式如下:

s.add( x )

将元素 x 添加到集合 s 中,如果元素已存在,则不进行任何操作。

thisset = set(("Google", "W3Cschool", "Taobao"))
thisset.add("Baidu")
print(thisset)

运行结果:

{'W3Cschool', 'Taobao', 'Google', 'Baidu'}

还有一个方法,也可以添加元素,且参数可以是列表,元组,字典等,语法格式如下:

s.update( x )

x 可以有多个,用逗号分开。

实例:

thisset = set(("Google", "w3Cschool", "Taobao"))
thisset.update({1,3})
print(thisset)
thisset.update([1,4],[5,6])
print(thisset)

运行结果:

{1, 3, 'w3Cschool', 'Taobao', 'Google'}
{1, 3, 4, 5, 6, 'w3Cschool', 'Taobao', 'Google'}

2、移除元素

语法格式如下:

s.remove( x )

将元素 x 从集合 s 中移除,如果元素不存在,则会发生错误。

实例:

thisset = set(("Google", "W3Cschool", "Taobao"))
thisset.remove("Taobao")
print(thisset)

thisset.remove("Facebook") # 不存在会发生错误

运行结果:

{'W3Cschool', 'Google'}
Traceback (most recent call last):
File ".code.tio", line 5, in
thisset.remove("Facebook") # 不存在会发生错误
KeyError: 'Facebook'

此外还有一个方法也是移除集合中的元素,且如果元素不存在,不会发生错误。格式如下所示:

s.discard( x )

实例:

thisset = set(("Google", "W3Cschool", "Taobao"))
thisset.discard("Facebook") # 不存在不会发生错误
print(thisset)

运行结果:

{'Taobao', 'Google', 'W3Cschool'}

我们也可以设置随机删除集合中的一个元素,语法格式如下:

s.pop()

实例:

thisset = set(("Google", "W3Cschool", "Taobao", "Facebook"))
x = thisset.pop()

print(x)
print(thisset)

输出结果:

Google
{'Facebook', 'Taobao', 'W3Cschool'}

多次执行测试结果都不一样。

set 集合的 pop 方法会对集合进行无序的排列,然后将这个无序排列集合的左面第一个元素进行删除。因为这个过程是不确定的,所以删除结果也是不确定的,不建议使用这种方式进行删除。

3、计算集合元素个数

语法格式如下:

len(s)

计算集合 s 的元素个数。

实例:

thisset = set(("Google", "W3Cschool", "Taobao"))
print(len(thisset))

运行结果:

3

4、清空集合

语法格式如下:

s.clear()

清空集合 s。

实例

thisset = set(("Google", "W3cschool", "Taobao"))
thisset.clear()
print(thisset)

运行结果:

set()

5、判断元素是否在集合中存在

语法格式如下:

x in s

判断元素 x 是否在集合 s 中,存在则返回 True,不存在则返回 False。

实例:

thisset = set(("Google", "W3Cschool", "Taobao"))
print("W3Cschool" in thisset)
print("Facebook" in thisset)

运行结果:

True
False

集合内置方法完整列表

方法描述
add()为集合添加元素
clear()移除集合中的所有元素
copy()拷贝一个集合
difference()返回多个集合的差集
difference_update()移除集合中的元素,该元素在指定的集合也存在。
discard()删除集合中指定的元素
intersection()返回集合的交集
intersection_update()返回集合的交集。
isdisjoint()判断两个集合是否包含相同的元素,如果没有返回 True,否则返回 False。
issubset()判断指定集合是否为该方法参数集合的子集。
issuperset()判断该方法的参数集合是否为指定集合的子集
pop()随机移除元素
remove()移除指定元素
symmetric_difference()返回两个集合中不重复的元素集合。
symmetric_difference_update()移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。
union()返回两个集合的并集
update()给集合添加元素