共计 2482 个字符,预计需要花费 7 分钟才能阅读完成。
列表生成式即 List Comprehensions,是 Python 内置的非常简单却强大的可以用来创建 list 的生成式。
举个例子,要生成 list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
可以用list(range(1, 11))
:
list(range(1, 11)) | |
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] |
但如果要生成 [1x1, 2x2, 3x3, ..., 10x10]
怎么做?方法一是循环:
L = [] | |
for x in range(1, 11): | |
L.append(x * x) | |
L | |
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100] |
但是循环太繁琐,而列表生成式则可以用一行语句代替循环生成上面的 list:
[x * x for x in range(1, 11)] | |
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100] |
写列表生成式时,把要生成的元素 x * x
放到前面,后面跟 for
循环,就可以把 list 创建出来,十分有用,多写几次,很快就可以熟悉这种语法。
for 循环后面还可以加上 if 判断,这样我们就可以筛选出仅偶数的平方:
[x * x for x in range(1, 11) if x % 2 == 0] | |
[4, 16, 36, 64, 100] |
还可以使用两层循环,可以生成全排列:
>>> [m + n for m in 'ABC' for n in 'XYZ'] | |
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ'] |
三层和三层以上的循环就很少用到了。
运用列表生成式,可以写出非常简洁的代码。例如,列出当前目录下的所有文件和目录名,可以通过一行代码实现:
import os # 导入 os 模块,模块的概念后面讲到 | |
for d in os.listdir('.')] # os.listdir 可以列出文件和目录 | [d|
['.emacs.d', '.ssh', '.Trash', 'Adlm', 'Applications', 'Desktop', 'Documents', 'Downloads', 'Library', 'Movies', 'Music', 'Pictures', 'Public', 'VirtualBox VMs', 'Workspace', 'XCode'] |
for
循环其实可以同时使用两个甚至多个变量,比如 dict
的items()
可以同时迭代 key 和 value:
d = {'x': 'A', 'y': 'B', 'z': 'C' } | |
for k, v in d.items(): | |
print(k, '=', v) | |
y = B | |
x = A | |
z = C |
因此,列表生成式也可以使用两个变量来生成 list:
'x': 'A', 'y': 'B', 'z': 'C' } | d = {|
'=' + v for k, v in d.items()] | [k +|
['y=B', 'x=A', 'z=C'] |
最后把一个 list 中所有的字符串变成小写:
'Hello', 'World', 'IBM', 'Apple'] | L = [|
for s in L] | [s.lower()|
['hello', 'world', 'ibm', 'apple'] |
if … else
使用列表生成式的时候,有些童鞋经常搞不清楚 if...else
的用法。
例如,以下代码正常输出偶数:
[x for x in range(1, 11) if x % 2 == 0] | |
[2, 4, 6, 8, 10] |
但是,我们不能在最后的 if
加上else
:
for x in range(1, 11) if x % 2 == 0 else 0] | [x|
File "<stdin>", line 1 | |
[x for x in range(1, 11) if x % 2 == 0 else 0] | |
^ | |
SyntaxError: invalid syntax |
这是因为跟在 for
后面的 if
是一个筛选条件,不能带else
,否则如何筛选?
另一些童鞋发现把 if
写在 for
前面必须加else
,否则报错:
if x % 2 == 0 for x in range(1, 11)] | [x|
File "<stdin>", line 1 | |
[x if x % 2 == 0 for x in range(1, 11)] | |
^ | |
SyntaxError: invalid syntax |
这是因为 for
前面的部分是一个表达式,它必须根据 x
计算出一个结果。因此,考察表达式:x if x % 2 == 0
,它无法根据 x
计算出结果,因为缺少else
,必须加上else
:
[x if x % 2 == 0 else -x for x in range(1, 11)] | |
[-1, 2, -3, 4, -5, 6, -7, 8, -9, 10] |
上述 for
前面的表达式 x if x % 2 == 0 else -x
才能根据 x
计算出确定的结果。
可见,在一个列表生成式中,for
前面的 if ... else
是表达式,而 for
后面的 if
是过滤条件,不能带else
。
练习
如果 list 中既包含字符串,又包含整数,由于非字符串类型没有 lower()
方法,所以列表生成式会报错:
>>> L = ['Hello', 'World', 18, 'Apple', None] | |
>>> [s.lower() for s in L] | |
Traceback (most recent call last): | |
File "<stdin>", line 1, in <module> | |
File "<stdin>", line 1, in <listcomp> | |
AttributeError: 'int' object has no attribute 'lower' |
使用内建的 isinstance
函数可以判断一个变量是不是字符串:
x = 'abc' | |
y = 123 | |
isinstance(x, str) | |
True | |
isinstance(y, str) | |
False |
请修改列表生成式,通过添加 if
语句保证列表生成式能正确地执行:
L1 = ['Hello', 'World', 18, 'Apple', None] | |
L2 = ??? | |
# 测试: | |
print(L2) | |
if L2 == ['hello', 'world', 'apple']: | |
print('测试通过!') | |
else: | |
print('测试失败!') |
参考源码
do_list_compr.py
小结
运用列表生成式,可以快速生成 list,可以通过一个 list 推导出另一个 list,而代码却十分简洁。
