Numpy中unsqueeze函数的功能特点及其使用技巧

2025-3-1

NumPy 的维度魔法师：深入探究 `unsqueeze` 函数

在 NumPy 的多维数组世界里，维度操作是家常便饭。有时我们需要增加数组的维度，以便进行广播运算、矩阵乘法或其他需要特定维度结构的操作。这时，NumPy 的 unsqueeze 函数就闪亮登场了，它像一位维度魔法师，能为数组巧妙地添加新的维度。本文将深入探究 unsqueeze 函数的功能特点、使用技巧，以及它在实际应用中的各种妙用。

1. `unsqueeze` 函数：初识维度扩展

numpy.unsqueeze 函数的主要功能是在指定位置插入一个新的维度，从而改变数组的形状（shape）。这个新维度的大小为 1，这意味着它不会改变数组中元素的总数，只是改变了数据的组织方式。

函数原型：

python numpy.unsqueeze(a, axis)

参数说明：

a：输入数组。可以是任何 NumPy 数组对象。
axis：整数或整数元组。指定新维度插入的位置。
- 如果 axis 是整数，则表示新维度插入到该索引之前。
- 如果 axis 是整数元组，则表示在多个位置插入多个新维度。

返回值：

一个与输入数组 a 具有相同数据但增加了维度的新数组。

基本用法示例：

```python
import numpy as np

创建一个一维数组

arr1d = np.array([1, 2, 3, 4])
print(f"原始数组形状：{arr1d.shape}") # 输出：原始数组形状：(4,)

在第 0 维之前插入新维度

arr2d_axis0 = np.unsqueeze(arr1d, axis=0)
print(f"在 axis=0 插入后的形状：{arr2d_axis0.shape}") # 输出：在 axis=0 插入后的形状：(1, 4)

在第 1 维之前插入新维度

arr2d_axis1 = np.unsqueeze(arr1d, axis=1)
print(f"在 axis=1 插入后的形状：{arr2d_axis1.shape}") # 输出：在 axis=1 插入后的形状：(4, 1)

使用元组在多个轴上进行扩展

arr3d = np.unsqueeze(arr1d, axis=(0, 1))
print(f"在 axis=(0,1) 插入后的形状：{arr3d.shape}") #输出：在 axis=(0,1) 插入后的形状：(1, 1, 4)
```

从上面的例子可以看出，unsqueeze 函数通过 axis 参数精确控制新维度的插入位置，使得数组的形状发生预期的改变。

2. `unsqueeze` 的核心机制：维度与索引

要深入理解 unsqueeze，我们需要理解 NumPy 数组的维度和索引的概念。

维度（Dimension）： 数组的维度指的是数组的轴（axis）的数量。例如，一维数组有一个轴，二维数组有两个轴，以此类推。
索引（Index）： 索引是用来访问数组中特定元素的位置。每个轴都有一个索引，从 0 开始。

unsqueeze 函数通过插入新的轴来增加维度。新轴的索引由 axis 参数指定。需要注意的是，axis 参数指定的是新轴插入的位置，而不是新轴本身的索引。

以下是更详细的解释和示例：

axis 为正数：
- 当 axis 为正数时，它表示新维度插入到现有维度之前。
- 例如，如果 axis=0，则新维度将成为第 0 维，原来的所有维度向后移动一位。
- 如果 axis=1，则新维度将成为第 1 维，以此类推。
```python
arr = np.array([1, 2, 3]) # 形状为 (3,)

在 axis=0 插入新维度

arr_axis0 = np.unsqueeze(arr, axis=0) # 形状为 (1, 3)

新维度成为第 0 维，原来的维度向后移动一位

在 axis=1 插入新维度

arr_axis1 = np.unsqueeze(arr, axis=1) # 形状为 (3, 1)

新维度成为第 1 维，原来的维度保持不变

```
axis 为负数：
- 当 axis 为负数时，它表示从后往前计数，-1 表示最后一个维度，-2 表示倒数第二个维度，以此类推。
- 例如，如果 axis=-1，则新维度将插入到最后一个维度之后。
- 如果 axis=-2，则新维度将插入到倒数第二个维度之后。
```python
arr = np.array([[1, 2], [3, 4]]) # 形状为 (2, 2)

在 axis=-1 插入新维度

arr_axis_neg1 = np.unsqueeze(arr, axis=-1) # 形状为 (2, 2, 1)

新维度插入到最后一个维度之后

在 axis=-2 插入新维度

arr_axis_neg2 = np.unsqueeze(arr, axis=-2) # 形状为 (2, 1, 2)

新维度插入到倒数第二个维度之后

`` 3. **axis为元组：** * 当axis`为一个元组时，可以在多个位置插入多个新维度。

```python
arr = np.array([1, 2, 3, 4]) # 形状为 (4,)

在 axis=(0, 2) 插入新维度

arr_axis_tuple = np.unsqueeze(arr, axis=(0, 2)) # 形状为 (1, 4, 1)

在第0维和第2维插入新维度

```

总结来说，unsqueeze 函数通过 axis 参数精确控制新维度插入的位置，理解 axis 参数的正负数含义以及与现有维度的关系是掌握 unsqueeze 的关键。

3. `unsqueeze` 的实用技巧与应用场景

unsqueeze 函数在 NumPy 的实际应用中非常广泛，以下是一些常见的实用技巧和应用场景：

广播机制的维度对齐：

NumPy 的广播机制允许不同形状的数组进行算术运算。广播机制会自动对维度较小的数组进行扩展，使其与维度较大的数组匹配。unsqueeze 可以手动进行维度对齐，使广播运算更易于理解和控制。

```python
a = np.array([1, 2, 3]) # 形状为 (3,)
b = np.array([[4], [5], [6]]) # 形状为 (3, 1)

直接相加会触发广播

c = a + b # 形状为 (3, 3)

使用 unsqueeze 进行显式维度对齐

a_expanded = np.unsqueeze(a, axis=1) # 形状为 (3, 1)
c_explicit = a_expanded + b # 形状为 (3, 3)

c 和 c_explicit 的结果相同，但 c_explicit 更清晰地展示了维度对齐的过程

print(np.array_equal(c, c_explicit)) #输出： True
```
矩阵乘法与向量运算：

在进行矩阵乘法或向量运算时，经常需要调整数组的维度。unsqueeze 可以将一维数组转换为列向量或行向量，以满足矩阵运算的要求。

```python
vector = np.array([1, 2, 3]) # 形状为 (3,)

转换为列向量 (3, 1)

column_vector = np.unsqueeze(vector, axis=1)

转换为行向量 (1, 3)

row_vector = np.unsqueeze(vector, axis=0)

现在可以进行矩阵乘法了

matrix = np.array([[4, 5, 6], [7, 8, 9], [10, 11, 12]])

result1 = np.dot(matrix, column_vector) # 矩阵与列向量相乘
result2 = np.dot(row_vector, matrix) # 行向量与矩阵相乘
```
图像处理：

在图像处理中，图像通常表示为多维数组。例如，灰度图像是二维数组，彩色图像是三维数组（高度、宽度、通道）。unsqueeze 可以用来增加或减少图像的维度，例如：
- 将灰度图像转换为单通道的彩色图像。
- 将多个单通道图像合并为一个多通道图像。
- 为图像添加批次维度（batch dimension），以便进行批量处理。
```python

假设有一个灰度图像 (28, 28)

gray_image = np.random.rand(28, 28)

转换为单通道彩色图像 (28, 28, 1)

color_image = np.unsqueeze(gray_image, axis=2)

添加批次维度 (1, 28, 28, 1)

batch_image = np.unsqueeze(color_image, axis=0)
```
深度学习：

在深度学习中，unsqueeze 经常用于调整数据的维度，以匹配神经网络模型的输入要求。例如，卷积神经网络（CNN）通常需要四维输入（批次大小、高度、宽度、通道），循环神经网络（RNN）通常需要三维输入（批次大小、时间步长、特征）。

```python

假设有一个时间序列数据 (100,)，表示 100 个时间步长的特征

time_series = np.random.rand(100)

调整为 RNN 的输入形状 (1, 100, 1)

rnn_input = np.unsqueeze(time_series, axis=(0, 2))

假设有一个图像数据 (28, 28)，表示 28x28 的灰度图像

image = np.random.rand(28, 28)

调整为 CNN 的输入形状 (1, 28, 28, 1)

cnn_input = np.unsqueeze(image, axis=(0, 3))
```
与其他 NumPy 函数结合：

unsqueeze 经常与其他 NumPy 函数结合使用，例如 concatenate、stack、expand_dims 等，以实现更复杂的维度操作。
* 与concatenate结合：
```python
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

希望结果是[[1, 2, 3], [4, 5, 6]]

先unsqueeze再concatenate

a_expand = np.unsqueeze(a, axis = 0) #shape (1,3)
b_expand = np.unsqueeze(b, axis = 0) #shape (1,3)

concatenate_result = np.concatenate((a_expand, b_expand), axis = 0) #shape (2,3)
print(concatenate_result) #输出 [[1 2 3]
# [4 5 6]]
* 与stack结合python
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
#希望在新的维度上堆叠，得到[[1, 2, 3], [4, 5, 6]]

#直接stack
stack_result = np.stack((a,b), axis=0)
print(stack_result) #输出 [[1 2 3]
# [4 5 6]]
```
在这个例子中，stack函数已经隐式地执行了类似unsqueeze的操作。

4. `unsqueeze` 与 `reshape`、`expand_dims` 的比较

NumPy 中还有其他几个函数可以改变数组的形状，例如 reshape 和 expand_dims。它们与 unsqueeze 有相似之处，但也有重要的区别。

reshape：
- reshape 函数可以改变数组的形状，但要求改变后的元素总数与原数组相同。
- reshape 可以增加维度，也可以减少维度，更加灵活。
- reshape 不会插入新的轴，而是重新排列现有元素。
```python
arr = np.array([1, 2, 3, 4, 5, 6])

reshape 为 (2, 3)

arr_reshaped = arr.reshape((2, 3))

reshape 为 (3, 2)

arr_reshaped2 = arr.reshape((3, 2))

reshape 为 (1, 6)

arr_reshaped3 = arr.reshape((1, 6))
```
expand_dims：
- expand_dims 函数与 unsqueeze 功能完全相同，都是在指定位置插入一个新的维度。
- expand_dims 可以看作是 unsqueeze 的别名。
```python
arr = np.array([1, 2, 3])

使用 expand_dims 在 axis=0 插入新维度

arr_expanded = np.expand_dims(arr, axis=0) # 形状为 (1, 3)

与 unsqueeze(arr, axis=0) 等价

```

总结：

unsqueeze 和 expand_dims 功能相同，专门用于插入新维度。
reshape 更通用，可以改变任意形状，但元素总数必须保持不变。
在只需要插入新维度时，unsqueeze 或 expand_dims 更直观。
在需要改变整体形状，或者减少维度时，应该使用 reshape。

5. 使用注意点

axis 的范围： axis 的值必须在 [-a.ndim - 1, a.ndim] 范围内，其中 a.ndim 是输入数组的维度数。超出范围会引发 IndexError。
内存共享： unsqueeze 通常返回原始数组的视图（view），这意味着它不会创建新的数组副本，而是共享原始数组的内存。修改 unsqueeze 返回的数组可能会影响原始数组。如果需要独立的副本，可以使用 copy() 方法。
与 None 索引： 在 NumPy 中，可以使用 None 作为索引来插入新维度，效果与 unsqueeze 相同。arr[None, :] 等价于 np.unsqueeze(arr, axis=0)，arr[:, None] 等价于 np.unsqueeze(arr, axis=1)。

维度操控的艺术

通过本文的详细解析，我们深入了解了 NumPy 中 unsqueeze 函数的功能、原理、技巧和应用场景。unsqueeze 函数是 NumPy 维度操作的重要工具，熟练掌握它可以让我们在处理多维数组时更加得心应手。掌握了unsqueeze，你就如同掌握了维度操控的艺术，能够在多维数据的世界里自由穿梭。希望本文能帮助您更好地理解和运用 unsqueeze 函数，提升您的 NumPy 编程技能。

作者：admin

链接：https://hostlocvps.com/2025/03/01/numpy%e4%b8%adunsqueeze%e5%87%bd%e6%95%b0%e7%9a%84%e5%8a%9f%e8%83%bd%e7%89%b9%e7%82%b9%e5%8f%8a%e5%85%b6%e4%bd%bf%e7%94%a8%e6%8a%80%e5%b7%a7/

文章版权归作者所有，未经允许请勿转载。

THE END

MongoDB Compass 使用指南：可视化工具详解

<<上一篇

英语代词Pronoun全攻略：从基础到进阶

下一篇>>

Numpy中unsqueeze函数的功能特点及其使用技巧

NumPy 的维度魔法师：深入探究 unsqueeze 函数

1. unsqueeze 函数：初识维度扩展

创建一个一维数组

在第 0 维之前插入新维度

在第 1 维之前插入新维度

使用元组在多个轴上进行扩展

2. unsqueeze 的核心机制：维度与索引

在 axis=0 插入新维度

新维度成为第 0 维，原来的维度向后移动一位

在 axis=1 插入新维度

新维度成为第 1 维，原来的维度保持不变

在 axis=-1 插入新维度

新维度插入到最后一个维度之后

在 axis=-2 插入新维度

新维度插入到倒数第二个维度之后

在 axis=(0, 2) 插入新维度

在第0维和第2维插入新维度

3. unsqueeze 的实用技巧与应用场景

直接相加会触发广播

使用 unsqueeze 进行显式维度对齐

c 和 c_explicit 的结果相同，但 c_explicit 更清晰地展示了维度对齐的过程

转换为列向量 (3, 1)

转换为行向量 (1, 3)

现在可以进行矩阵乘法了

假设有一个灰度图像 (28, 28)

转换为单通道彩色图像 (28, 28, 1)

添加批次维度 (1, 28, 28, 1)

假设有一个时间序列数据 (100,)，表示 100 个时间步长的特征

调整为 RNN 的输入形状 (1, 100, 1)

假设有一个图像数据 (28, 28)，表示 28x28 的灰度图像

调整为 CNN 的输入形状 (1, 28, 28, 1)

希望结果是[[1, 2, 3], [4, 5, 6]]

先unsqueeze再concatenate

4. unsqueeze 与 reshape、expand_dims 的比较

reshape 为 (2, 3)

reshape 为 (3, 2)

reshape 为 (1, 6)

使用 expand_dims 在 axis=0 插入新维度

与 unsqueeze(arr, axis=0) 等价