yogoma 2020-02-13
Python中,赋值与拷贝(深/浅拷贝)之间是有差异的,这主要源于数据在内存中的存放问题,本文将对此加以探讨。
赋值不会改变内存中数据存放状态,比如在内存中存在一个名为data的数据,此时若执行语句data_01 = data,则现在该份数据有了两个名称(data和data_01),其余都不发生改变,使用任何一个名称对数据进行操作,那么用另外一个名称拿数据时,数据会呈现之间发生的改变。示例如下:
图中,给列表分配了两个名称a与b,对a做改变时b会同样改变,对b做改变时a也会同样改变,a,b指向内存中同一块区域。
无论是哪种拷贝,数据会重新生成一份放置在另一块内存区域,内存存放状态会因此发生改变,但重新生成的数据会因为深浅拷贝不同而有所不同。
上图中,虽然b复制了a的数据存放到另一块内存区域,但复制的程度有限,只达到列表的第一层,第二层的数据存放状态并没有改变。
深度拷贝则是完完全全地复制,有几层则拷几层。
下面以一个三层的列表为例:
对于python中的这三种数据复制机制,如果能够从内存层面理解,则会非常容易;这三种复制机制也会反映在一些第三方库中,如numpy、pandas等,对于不同的数据分析情况,要有选择地调取合适的复制机制。