Python 中变量交换的奇怪现象
前言
某日,某君抛给我一段 python 代码:
seq = [1, 2, -1, 0]
seq[0], seq[seq.index(max(seq))] = seq[seq.index(max(seq))], seq[0]
seq[len(seq) - 1], seq[seq.index(min(seq))] = seq[seq.index(min(seq))], seq[len(seq) - 1]
print(seq)
某君不理解程序的输出,想要我解释一下。
在继续阅读之前,读者不妨思考一下程序的输出。
程序的输出
[1, 2, 0, -1]。
某君的目的
某君要实现的目的很简单:
将一个序列里面最大的元素和第一个元素进行交换,将最小的元素和最后一个元素进行交换(暂不考虑效率)。
某君的困惑
某君发现上面的代码不能交换最大的元素但是可以交换最小的元素,这是某君最大的困惑。 在某君看来,其认为两行代码的逻辑完全一致,要是能够成功运行,那么两行代码应该都成功或者都失败, 绝不可能是一个成功一个失败。
当某君问我的时候,我也觉得其说的在理。但是能明显的感觉到正确的写法, 应该是先记录最大和最小元素的下标然后在进行交换,即正确代码应该是形如下面的代码:
seq = [1, 2, -1, 0]
minElement = seq.index(min(seq))
maxElement = seq.index(max(seq))
seq[0], seq[maxElement] = seq[maxElement], seq[0]
seq[len(seq) - 1], seq[minElement] = seq[minElement], seq[len(seq) - 1]
print(seq)
上面的代码能够输出预期结果 [2, 1, 0, -1]。
踏破铁鞋无觅处
对于上面的代码我们需要搞清楚各个语句的执行顺序,对于等号与逗号表达式,其各自的执行顺序如下:
- 对于赋值运算符而言:从右到左依次执行,有多个等号的时候,从最右边的等号先开始执行。
 - 逗号表达式:从左到右依次执行
 
我们需要考虑上面的代码做了什么,上面的代码实际上有两步:
- 获取赋值运算符右边的值,将结果打包成一个元组;
 - 将元组的值 依次 赋值给左边的变量。
 
问题的关键就在于 依次 两字,如果是 一次性 赋值给左边的话, 那么一开始就会对左边的变量计算出来。 以交换最大值为例,如果是 一次性 赋值,那么上面会变成:seq[0], seq[1] = seq[1], seq[0], 所以能够进行正常的交换。而如果是 依次 问题就出现了:
- 计算出赋值运算符右边并包装成元组,即 
(seq[1], seq[0])也就是(2, 1); - 依次进行赋值,首先是 
seq[0] = 2,完成该赋值后seq = [2, 2, -1, 0]; - 接下来执行 
seq[s.index(max(seq))] = 1, 由于seq已经发生变化此时s.index(max(seq))会返回第一个等于 \(2\) 的元素下标即 \(0\), 即执行seq[0] = 1,完成赋值后seq = [1, 2, -1, 0]。 
可以发现上面的代码实际上确实发生了两次赋值,但是都是对同一位置的元素进行赋值,导致最终的结果不变。
接下来我们分析为什么能够成功交换最小值和最后一个元素:
- 首先计算出赋值运算符右边并包装成元组,即 
(seq[2], seq[3])也就是(-1, 0); - 第一次赋值操作 
seq[3] = -1,完成赋值后seq = [1, 2, -1, -1]; - 第二次赋值操作 
seq[s.index(min(seq))] = 0,由于s.index()返回的是第一个找到的元素, 所以其返回值为 \(2\),即执行seq[2] = 0,完成赋值后seq = [1, 2, 0, -1]。 
如果你成功理解了上面的过程可以试着分析如下的代码:
# 1
seq = [1, 2, -1, 0]
seq[seq.index(max(seq))], seq[0] = seq[0], seq[seq.index(max(seq))]
print(seq)
# 2
seq = [1, 2, -1, 0]
seq[seq.index(min(seq))], seq[len(seq) - 1] = seq[len(seq) - 1], seq[seq.index(min(seq))]
print(seq)
上面代码的输出:
[2, 1, -1, 0]
[1, 2, 0, -1]
如果你经过分析,那么不难发现上面的代码是符合逻辑的,能够成功进行交换, 因为其保证在序列变化前就获得了元素的下标。 不过并不推荐使用上面的写法,更推荐使用变量存储下标值,以防止出现之前的「错误」。
良好的编程习惯
发生上面的错误时在变化中引入变化。 即在上面的过程中同时引入了两个变化的过程。 另外的一个常见错误是: 在遍历一个容器的同时,向容器中增加元素,以 C++ 为例,初学者同样容易发生如下的错误:
std::vector<int> v{0, 1, 2, 3};
for (int i = 0; i < v.size(); i++) { v.push_back(i); }
上面代码的本意是希望在 v 后面再追加 v 中的元素, 但是由于每一次 push_back 都会导致 v.size() 增加,因此上面的代码会发生死循环,正确的代码如下:
std::vector<int> v{0, 1, 2, 3};
int n = (int)v.size();
for (int i = 0; i < n; i++) { v.push_back(i); }
在编写代码的时候不应该在变化中引入变化,这样的代码不仅不容易阅读,而且容易出现 bugs。
Enjoy Reading This Article?
Here are some more articles you might like to read next: