Python numpy squeeze：降维操作的终极指南

2025-3-15

Python NumPy squeeze()：降维操作的终极指南

在数据科学和机器学习领域，我们经常需要处理高维数组。NumPy，作为 Python 中最流行的数值计算库，提供了强大的多维数组对象（ndarray）以及一系列操作这些数组的函数。其中，numpy.squeeze() 函数是一个看似简单却非常实用的工具，专门用于降低数组的维度。本文将深入探讨 squeeze() 函数的各个方面，包括其基本原理、用法、应用场景、注意事项以及与其他降维方法的比较，旨在为您提供一份全面的 squeeze() 函数使用指南。

1. 什么是维度和降维？

在深入了解 squeeze() 函数之前，我们需要先理解维度和降维的概念。

1.1 维度 (Dimension)

在 NumPy 中，数组的维度指的是数组的轴 (axis) 的数量。更直观地说，维度可以理解为数组嵌套的层数。

标量 (Scalar)： 0 维数组，就是一个单独的数字，例如 5，3.14。
向量 (Vector)： 1 维数组，就是一列或一行数字，例如 [1, 2, 3]。
矩阵 (Matrix)： 2 维数组，就是一个表格，有行和列，例如：

[[1, 2, 3], [4, 5, 6]]
* 张量 (Tensor)： 3 维及以上的数组，可以看作是矩阵的堆叠，或者更高维度的扩展。例如，一个 RGB 彩色图像就是一个 3 维数组，其维度分别为高度、宽度和颜色通道 (Red, Green, Blue)。

1.2 降维 (Dimensionality Reduction)

降维是指减少数组维度的过程。在数据分析和机器学习中，降维有多种目的：

数据压缩： 减少数据存储空间。
可视化： 将高维数据降至 2 维或 3 维，以便于绘制图形进行观察。
特征提取： 提取数据中最关键的特征，去除冗余信息，提高模型效率和准确性。
去除噪声： 消除数据中的噪声和无关维度。

NumPy 提供了多种降维方法，squeeze() 函数是其中一种，专门用于移除长度为 1 的维度。

2. NumPy squeeze() 函数详解

2.1 基本语法

numpy.squeeze() 函数的语法非常简单：

python numpy.squeeze(a, axis=None)

a： 输入数组 (array_like)。
axis： 可选参数，指定要移除的轴。
- None (默认值)：移除所有长度为 1 的维度。
- 整数：移除指定的轴（轴的索引从 0 开始）。
- 整数元组：移除元组中指定的多个轴。

2.2 功能描述

squeeze() 函数的作用是移除数组中长度为 1 的维度。它会返回一个新的数组，该数组与原数组共享数据（即不创建副本），但维度更低。

2.3 示例

让我们通过几个例子来理解 squeeze() 的用法：

```python
import numpy as np

示例 1：移除所有长度为 1 的维度

arr1 = np.array([[[1], [2], [3]]]) # 形状为 (1, 3, 1)
arr1_squeezed = np.squeeze(arr1)
print(f"arr1 的形状：{arr1.shape}")
print(f"arr1_squeezed 的形状：{arr1_squeezed.shape}")
print(f"arr1_squeezed 的内容：\n{arr1_squeezed}")

示例 2：指定要移除的轴

arr2 = np.array([[[1, 2, 3]]]) # 形状为 (1, 1, 3)
arr2_squeezed_axis0 = np.squeeze(arr2, axis=0) # 移除第 0 轴
arr2_squeezed_axis1 = np.squeeze(arr2, axis=1) # 移除第 1 轴

arr2_squeezed_axis2 = np.squeeze(arr2, axis=2) # 报错！因为第 2 轴的长度不是 1

print(f"arr2 的形状：{arr2.shape}")
print(f"arr2_squeezed_axis0 的形状：{arr2_squeezed_axis0.shape}")
print(f"arr2_squeezed_axis1 的形状：{arr2_squeezed_axis1.shape}")

示例 3：使用整数元组移除多个轴

arr3 = np.array([[[[1], [2], [3]]]]) # 形状为 (1, 1, 3, 1)
arr3_squeezed_tuple = np.squeeze(arr3, axis=(0, 3)) # 移除第 0 轴和第 3 轴
print(f"arr3 的形状：{arr3.shape}")
print(f"arr3_squeezed_tuple 的形状：{arr3_squeezed_tuple.shape}")
```

输出结果：

arr1 的形状：(1, 3, 1) arr1_squeezed 的形状：(3,) arr1_squeezed 的内容： [1 2 3] arr2 的形状：(1, 1, 3) arr2_squeezed_axis0 的形状：(1, 3) arr2_squeezed_axis1 的形状：(1, 3) arr3 的形状：(1, 1, 3, 1) arr3_squeezed_tuple 的形状：(1, 3)

解释：

示例 1： arr1 的形状为 (1, 3, 1)，有两个长度为 1 的维度。squeeze() 函数默认移除所有长度为 1 的维度，因此 arr1_squeezed 的形状变为 (3,)，成为一个一维数组。
示例 2： arr2 的形状为 (1, 1, 3)，前两个维度长度为 1。我们通过 axis 参数分别指定移除第 0 轴和第 1 轴，结果形状都变为 (1, 3)。如果尝试移除第 2 轴，会引发 ValueError，因为第 2 轴的长度为 3，不是 1。
示例 3： arr3 的形状为 (1, 1, 3, 1)，有三个维度长度为 1。我们使用整数元组 (0, 3) 指定同时移除第 0 轴和第 3 轴，结果形状变为 (1, 3)。

2.4 注意事项

squeeze() 函数只能移除长度为 1 的维度。如果尝试移除长度不为 1 的维度，会引发 ValueError。
squeeze() 函数返回的是原数组的视图 (view)，而不是副本。这意味着对返回数组的修改会影响到原数组。如果需要创建副本，可以使用 copy() 方法。

3. squeeze() 函数的应用场景

squeeze() 函数在许多场景中都非常有用，特别是在处理机器学习模型的输入和输出时。

3.1 机器学习模型输入

许多机器学习库（如 TensorFlow、PyTorch）要求输入数据的维度满足特定格式。有时，我们从数据集中加载的数据可能包含不必要的长度为 1 的维度。这时，可以使用 squeeze() 函数来移除这些维度，使数据符合模型的要求。

例如，一个单通道的灰度图像，其形状可能为 (1, 28, 28, 1)，表示 1 张 28x28 像素的图像，通道数为 1。对于某些模型，可能只需要 (28, 28) 的形状，这时可以使用 squeeze() 函数：

```python
import numpy as np

image = np.random.rand(1, 28, 28, 1)
image_squeezed = np.squeeze(image)
print(image_squeezed.shape) # 输出：(28, 28)
```

3.2 机器学习模型输出

类似地，一些模型的输出可能包含长度为 1 的维度。例如，一个二分类模型的输出形状可能为 (batch_size, 1)，表示每个样本属于正类的概率。如果我们只需要一个包含概率值的一维数组，可以使用 squeeze() 函数：

```python
import numpy as np

predictions = np.array([[0.8], [0.2], [0.9]]) # 形状为 (3, 1)
predictions_squeezed = np.squeeze(predictions)
print(predictions_squeezed.shape) # 输出：(3,)
```

3.3 广播机制的调整

NumPy 的广播机制 (broadcasting) 允许不同形状的数组进行算术运算。有时，为了使广播机制正常工作，我们需要调整数组的维度。squeeze() 函数可以帮助我们移除不必要的长度为 1 的维度，从而实现正确的广播。

3.4 数据格式转换

在处理不同来源的数据时，可能会遇到数据格式不一致的情况。squeeze() 函数可以帮助我们将数据转换为统一的格式，方便后续处理。

4. squeeze() 与其他降维方法的比较

NumPy 提供了多种降维方法，除了 squeeze()，还有 reshape()、ravel()、flatten()、expand_dims()等。它们各有特点，适用于不同的场景。

4.1 squeeze() vs. reshape()

squeeze()： 专门用于移除长度为 1 的维度，不能改变其他维度的大小。
reshape()： 更通用，可以改变数组的形状为任意兼容的形状，但需要手动指定新形状。

```python
import numpy as np

arr = np.array([[[1, 2, 3]]]) # 形状为 (1, 1, 3)

使用 squeeze() 移除长度为 1 的维度

arr_squeezed = np.squeeze(arr) # 形状变为 (3,)

使用 reshape() 改变形状

arr_reshaped = arr.reshape(3) # 形状变为 (3,)
arr_reshaped_2d = arr.reshape(1, 3) # 形状变为 (1, 3)
```

4.2 squeeze() vs. ravel() 和 flatten()

squeeze()： 移除长度为 1 的维度，可能返回多维数组。
ravel()： 将多维数组展平为一维数组，总是返回原数组的视图。
flatten()： 将多维数组展平为一维数组，总是返回原数组的副本。

```python
import numpy as np

arr = np.array([[[1], [2], [3]]]) # 形状为 (1, 3, 1)

使用 squeeze() 移除长度为 1 的维度

arr_squeezed = np.squeeze(arr) # 形状变为 (3,)

使用 ravel() 展平为一维数组

arr_raveled = arr.ravel() # 形状变为 (3,)

使用 flatten() 展平为一维数组

arr_flattened = arr.flatten() # 形状变为 (3,)
```

4.3 squeeze() vs. expand_dims()

squeeze() : 用于移除长度为 1 的维度。
expand_dims() : 用于增加长度为 1 的维度, 与squeeze()的功能相反。

```python
import numpy as np
arr = np.array([1, 2, 3])

使用 expand_dims() 在指定轴上增加一个维度

arr_expanded = np.expand_dims(arr, axis=0) # 形状变为 (1, 3)
arr_expanded = np.expand_dims(arr, axis=1) # 形状变为 (3, 1)

使用 squeeze() 移除长度为 1 的维度

arr_squeeze = np.squeeze(arr_expanded) #形状变为(3,)

```

5. 总结

numpy.squeeze() 函数是一个简单而强大的工具，用于移除 NumPy 数组中长度为 1 的维度。它可以帮助我们：

简化数据结构
适应机器学习模型的输入输出要求
调整广播机制
转换数据格式

通过本文的详细介绍，您应该已经掌握了 squeeze() 函数的用法、应用场景以及与其他降维方法的区别。在实际应用中，根据具体需求选择合适的降维方法，可以提高代码效率和可读性。希望本文能帮助您更好地理解和使用 NumPy 的 squeeze() 函数！

作者：admin

链接：https://hostlocvps.com/2025/03/15/python-numpy-squeeze%ef%bc%9a%e9%99%8d%e7%bb%b4%e6%93%8d%e4%bd%9c%e7%9a%84%e7%bb%88%e6%9e%81%e6%8c%87%e5%8d%97/

文章版权归作者所有，未经允许请勿转载。

THE END

OpenCV GitHub源码解析与贡献指南

<<上一篇

Kibana数据可视化：打造交互式仪表盘

下一篇>>