NumPy 数组大全

NumPy 是一个Python 库，用于 Python 编程中的科学计算。在本教程中，你将学习如何在 NumPy 数组上以多种方式添加、删除、排序和操作元素。

NumPy 提供了一个多维数组对象和其他派生数组，例如掩码数组和掩码多维数组。

为什么要用 NumPy

NumPy 提供了一个 ndarray 对象，可以使用它来对任何维度的数组进行操作。 ndarray 代表 N 维数组，其中 N 是任意数字。这意味着 NumPy 数组可以是任何维度的。

与 Python 的 List 相比，NumPy 具有许多优势。我们可以在 NumPy 阵列上执行高性能操作，例如：

对数组成员进行排序
数学和逻辑运算
输入/输出功能
统计和线性代数运算

安装 NumPy

要安装NumPy，你的电脑上要先有 Python 和 Pip。

在终端中运行以下命令：

pip install numpy

然后你就可以在脚本中导入 NumPy 了，如下所示：

import numpy

添加数组元素

可以用 NumPy 模块的 append() 方法向 NumPy 数组中添加元素。

append() 的语法如下：

numpy.append(array, value, axis)

value 会被追加到在数组的末尾，并返回一个包含所有元素的 ndarray。

参数 axis 是一个可选的整数，用于定义数组的显示方式。如果没有指定，则数组结构将展平，稍后会演示用法。

以下示例，其中首先声明数组，然后用 append 方法向数组添加更多的值：

import numpy
a = numpy.array([1, 2, 3])
newArray = numpy.append (a, [10, 11, 12])
print(newArray)
# 输出：[ 1  2  3 10 11 12]

添加一列

也可以用NumPy 的 append() 方法插入一列。

在下面的例子中，我们创建了一个二维数组并插入了两列：

import numpy

a = numpy.array([[1, 2, 3], [4, 5, 6]]) 
b = numpy.array([[400], [800]])
newArray = numpy.append(a, b, axis = 1)
print(newArray)

"""
输出：
[[  1   2   3 400]
 [  4   5   6 800]]
"""

如果没有使用 axis 参数，则会输出：

[  1   2   3   4   5   6 400 800]

这就是数组结构的扁平化。

在 NumPy 中，还可以用 insert() 方法插入元素或列。两者之间的区别在于 insert() 方法可以指定要在哪个索引处添加元素，但 append() 方法会在数组的末尾添加一个值。

Consider the example below:
考虑以下示例：

import numpy
a = numpy.array([1, 2, 3])
newArray = numpy.insert(a, 1, 90) 
print(newArray)
# 输出：[ 1 90  2  3]

这里 insert() 方法在索引1处添加元素。在Python中数组索引从0开始。

追加一行

也可以用 append() 方法向数组添加行，就像在数组中附加元素一样简单：

import numpy
a = numpy.array([[1, 2, 3], [4, 5, 6]])
newArray = numpy.append(a, [[50, 60, 70]], axis = 0)
print(newArray)
"""
输出“
[[ 1  2  3]
 [ 4  5  6]
 [50 60 70]]
"""

删除元素

可以用 NumPy 模块的 delete() 方法删除 NumPy 数组元素：

import numpy 
a = numpy.array([1, 2, 3]) 
newArray = numpy.delete(a, 1, axis = 0) 
print(newArray)
# 输出：[1 3]

在本例子中，我们有一个一维数组，用 delete() 方法从数组中删除了索引 1 处的元素。

删除一行

同样，你也可以用 delete() 方法删除行。

下面的例子中我们从二维数组中删除了一行：

import numpy 
a = numpy.array([[1, 2, 3], [4, 5, 6], [10, 20, 30]]) 
newArray = numpy.delete(a, 1, axis = 0)
print(newArray)
"""
输出：
[[ 1  2  3]
 [10 20 30]]
"""

在 delete() 方法中，首先给出数组，然后给出要删除的元素的索引。在上例中，我们删除了索引为 1 的元素。

检查 NumPy 数组是否为空

可以用 size 方法返回数组中元素的总数。

在下面的例子中有一个 if 语句，通过 ndarray.size 检查数组中是否有元素，其中 ndarray 可以是任何给定的 NumPy 数组：

import numpy

a = numpy.array([1, 2, 3]) 
if(a.size == 0): 
    print("The given Array is empty") 
else: 
    print("The array = ", a)
# 输出：The array =  [1 2 3]

在上面的代码中，数组中有三个元素，因此它不是空的，判断条件将返回false。如果数组中没有元素，则 if 条件会变为 true 并且将打印空消息。如果数组等于：

a = numpy.array([])

上述代码将会输出：

The given Array is empty

查找值的索引

要查找值对应的索引，可以用 NumPy 模块的 where() 方法，如下例所示：

import numpy
a = numpy.array([1, 2, 3, 4, 5])
print("5 is found at index: ", numpy.where(a == 5))
# 输出：5 is found at index:  (array([4]),)

如果你只想得到索引，可以这样写：

import numpy

a = numpy.array([1, 2, 3, 4, 5]) 
index = numpy.where(a == 5)
print("5 is found at index: ", index[0])
#输出： 5 is found at index:  [4]

NumPy 数组切片

数组切片是从给定数组中提取子集的过程。你可以用冒号（ : ）运算符对数组进行切片，并指定数组索引的开始和结束位置，例如：

array[from:to]

下面的例子中提取从索引 2 到索引 5 的元素：

import numpy
a = numpy.array([1, 2, 3, 4, 5, 6, 7, 8])
print("A subset of array a = ", a[2:5])
# 输出：A subset of array a =  [3 4 5]

如果想要提取最后三个元素，可以通过用负切片来完成操作，如下所示：

import numpy
a = numpy.array([1, 2, 3, 4, 5, 6, 7, 8])
print("A subset of array a = ", a[-3:])
# 输出：A subset of array a =  [6 7 8]

将函数作用于所有数组元素

在下面的例子中，我们将创建一个 lambda 函数，并传入一个数组，以其应用于所有元素：

import numpy
addition = lambda x: x + 2
a = numpy.array([1, 2, 3, 4, 5, 6])
print("Array after addition function: ", addition(a))
# 输出：Array after addition function:  [3 4 5 6 7 8]

在此例中，创建了一个 lambda 函数，它使每个元素都递增 2。

NumPy 数组的长度

要得到 NumPy 数组的长度，可以用 size 属性，如下所示：

import numpy 
a = numpy.array([1, 2, 3, 4, 5, 6]) 
print("The size of array = ", a.size)
# 输出：The size of array =  6

从 list 创建 NumPy 数组

假设你有一个列表：

l = [1, 2, 3, 4, 5]

现在要根据这个列表创建一个数组，可以用 NumPy 模块的 array() 方法：

import numpy 
l = [1, 2, 3, 4, 5] 
a = numpy.array(l) 
print("The NumPy array from Python list = ", a)
# 输出：The NumPy array from Python list =  [1 2 3 4 5]

同样，使用 array() 方法，也可以从元组创建 NumPy 数组。如下所示：

import numpy
t = (1, 2, 3, 4, 5) 
a = numpy.array(t) 
print("The NumPy array from Python Tuple = ", a)
# 输出：The NumPy array from Python Tuple =  [1 2 3 4 5]

将 NumPy 数组转换为 list

要将数组转换为list，可以使用 NumPy 模块的 tolist()方法。

import numpy 
a = numpy.array([1, 2, 3, 4, 5]) 
print("Array to list = ", a.tolist())
# 输出：Array to list =  [1, 2, 3, 4, 5]

在这段代码中，我们简单地调用了 tolist() 方法，该方法将数组转换为列表。然后将新创建的列表打印到输出屏幕。

把 NumPy 数组导出为 CSV

要将数组导出为 CSV 文件，可以用 NumPy 模块的 savetxt() 方法，如下所示：

import numpy 
a = numpy.array([1, 2, 3, 4, 5]) 
numpy.savetxt("myArray.csv", a)

此代码将在 Python 代码文件所在路径下生成 CSV 文件。当然你也可以指定路径。

该文件的内容如下：

1.000000000000000000e+00
2.000000000000000000e+00
3.000000000000000000e+00
4.000000000000000000e+00
5.000000000000000000e+00

你可以把额外填充的零删除，如下所示：

numpy.savetxt("myArray.csv", a,fmt='%.2f')

对 NumPy 数组排序

可以用 NumPy 模块的 sort() 方法对 NumPy 数组进行排序：

sort() 函数有一个可选参数 axis（整数），默认为 -1。axis 指定我们要对数组进行排序的轴。 -1 表示将根据最后一个轴对数组进行排序。

import numpy 
a = numpy.array([16, 3, 2, 6, 8, 10, 1]) 
print("Sorted array = ", numpy.sort(a))
# 输出：Sorted array =  [ 1  2  3  6  8 10 16]

在这个例子中，我们在 print 语句中调用了 sort() 方法。数组 a 被传递给 sort 函数。

归一化数组

归一化数组是指将数组的值置于某个定义范围的过程。例如，我们想要在 -1 和 1 之间对数组进行归一化，依此类推。

归一化的公式如下：

x = (x – xmin) / (xmax – xmin)

现在把这个公式用于我们的数组。要查找数组中的最大和最小项，可以分别用 NumPy 的 max() 和 min() 方法。

import numpy 
x= numpy.array([400, 800, 200, 700, 1000, 2000, 300]) 
xmax = x.max() 
xmin = x.min() 
x = (x - xmin)/(xmax - xmin) 
print("After normalization array x = \n", x)
"""
输出：
After normalization array x =
 [0.11111111 0.33333333 0.         0.27777778 0.44444444 1.
 0.05555556]
"""

数组索引

索引指向数组中的一个元素。在下面的例子中，分别用到了一维和二维数组中的索引：

import numpy 
a = numpy.array([20, 13, 42, 86, 81, 9, 11]) 
print("Element at index 3 = ", a[3])
# 输出：Element at index 3 =  86

下面是二维数组：

import numpy 
a = numpy.array([[20, 13, 42], [86, 81, 9]]) 
print("Element at index a[1][2] = ", a[1][2])
# 输出：Element at index a[1][2] =  9

索引 [1][2] 表示第二行和第三列（索引从 0 开始）。因此在屏幕上输出 9 。

将 NumPy 数组附加到另一个数组上

可以用 append() 方法将 NumPy 数组附加到另一个 NumPy 数组上。

import numpy 
a = numpy.array([1, 2, 3, 4, 5]) 
b = numpy.array([10, 20, 30, 40, 50]) 
newArray = numpy.append(a, b) 
print("The new array = ", newArray)
# 输出：The new array =  [ 1  2  3  4  5 10 20 30 40 50]

在此例中，创建两个 NumPy 数组 a， b 。然后把两个数组传给 append()。当数组 b 作为第二个参数传递时，将被添加到数组 a 的末尾。

总结

正如大家所见，NumPy 数组用起来非常简单。在使用很多机器学习库时，NumPy 数组非常重要。可以说NumPy 是人工智能的大门。