掌握Numpy Stack：轻松实现数组的维度扩展

2025-3-24

掌握 NumPy Stack：轻松实现数组的维度扩展

在数据科学和机器学习领域，NumPy 库是 Python 中进行数值计算的基石。它提供了强大的 N 维数组对象（ndarray）以及一系列高效的数组操作函数。其中，stack 函数族（包括 np.stack、np.hstack、np.vstack、np.dstack、np.concatenate）是用于组合多个数组的重要工具，它们可以在不同维度上扩展数组，为数据处理和分析提供了极大的灵活性。

本文将深入探讨 NumPy 的 stack 函数族，详细介绍其用法、原理、应用场景，并通过丰富的示例代码帮助您彻底掌握这些强大的工具。

1. NumPy Stack 基础

1.1 什么是数组堆叠？

数组堆叠（Stacking）是指将多个数组沿着新的轴（维度）或现有轴进行连接，从而创建一个更高维度的数组。想象一下，您有一堆纸牌，您可以将它们水平堆叠（hstack），垂直堆叠（vstack），或者沿着深度方向堆叠（dstack），从而形成不同形状的牌堆。NumPy 的 stack 函数族正是提供了类似的功能，让您能够灵活地组合数组。

1.2 `np.stack`：创建新维度

np.stack 是最通用的堆叠函数，它沿着一个新的轴连接数组序列。这意味着输出数组的维度会比输入数组的维度高 1。

函数签名：

python numpy.stack(arrays, axis=0, out=None)

参数：

arrays：需要堆叠的数组序列（列表、元组等），这些数组必须具有相同的形状。
axis：指定沿着哪个新轴进行堆叠，默认为 0。axis 的取值范围是 [- (ndim + 1), ndim]，其中 ndim 是输入数组的维度。正数表示从前往后数轴的索引，负数表示从后往前数轴的索引。
out：可选参数，用于指定输出数组。

示例：

```python
import numpy as np

创建两个一维数组

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

沿着新的轴 0 堆叠（默认）

c = np.stack((a, b))
print(c)

输出：

[[1 2 3]

[4 5 6]]

print(c.shape) # (2, 3) - 变成了二维数组

沿着新的轴 1 堆叠

d = np.stack((a, b), axis=1)
print(d)

输出：

[[1 4]

[2 5]

[3 6]]

print(d.shape) # (3, 2) - 变成了二维数组

创建两个二维数组

arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])

沿轴 0 堆叠

stacked_0 = np.stack((arr1, arr2), axis=0)
print(stacked_0)

[[[1 2]

[3 4]]

[[5 6]

[7 8]]]

print(stacked_0.shape) # (2, 2, 2) - 变成了三维数组

沿轴 1 堆叠

stacked_1 = np.stack((arr1, arr2), axis=1)
print(stacked_1)

[[[1 2]

[5 6]]

[[3 4]

[7 8]]]

print(stacked_1.shape) # (2, 2, 2) - 变成了三维数组

沿轴 2 堆叠

stacked_2 = np.stack((arr1, arr2), axis=2)
print(stacked_2)

[[[1 5]

[2 6]]

[[3 7]

[4 8]]]

print(stacked_2.shape) # (2, 2, 2) - 变成了三维数组

使用负轴索引

stacked_neg1 = np.stack((arr1, arr2), axis=-1) # 等同于 axis=2
print(stacked_neg1.shape)
print(stacked_neg1)

(2, 2, 2)

[[[1 5]

[2 6]]

[[3 7]

[4 8]]]

```

从示例中可以看出，np.stack 通过引入新轴，将原本相同维度的数组提升到了更高的维度。理解 axis 参数是关键，它决定了新轴插入的位置。

1.3 `np.hstack`：水平堆叠

np.hstack 是 np.concatenate 的一种特殊情况，它沿着水平方向（轴 1）连接数组。可以理解为将多个数组在列的方向上拼接起来。

函数签名：

python numpy.hstack(tup)

参数：

tup：需要堆叠的数组序列。除了轴 1 之外，这些数组在其他维度上必须具有相同的形状。

示例：

```python
import numpy as np

创建两个一维数组

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

水平堆叠

c = np.hstack((a, b))
print(c)

输出：[1 2 3 4 5 6]

print(c.shape) # (6,)

创建两个二维数组

arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])

水平堆叠

hstacked = np.hstack((arr1, arr2))
print(hstacked)

[[1 2 5 6]

[3 4 7 8]]

print(hstacked.shape) # (2, 4)
```

np.hstack 主要用于在列方向上扩展数组，例如将多个特征向量拼接成一个特征矩阵。

1.4 `np.vstack`：垂直堆叠

np.vstack 也是 np.concatenate 的一种特殊情况，它沿着垂直方向（轴 0）连接数组。可以理解为将多个数组在行的方向上拼接起来。

函数签名：

python numpy.vstack(tup)

参数：

tup: 需要堆叠的数组序列。除了轴0之外，这些数组在其他维度上必须具有相同的形状。

示例：

```python
import numpy as np

创建两个一维数组

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

垂直堆叠（注意：一维数组会被视为行向量）

c = np.vstack((a, b))
print(c)

输出：

[[1 2 3]

[4 5 6]]

print(c.shape) # (2, 3)

创建两个二维数组

arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])

垂直堆叠

vstacked = np.vstack((arr1, arr2))
print(vstacked)

[[1 2]

[3 4]

[5 6]

[7 8]]

print(vstacked.shape) # (4, 2)
```

np.vstack 主要用于在行方向上扩展数组，例如将多个样本数据拼接成一个数据集。

1.5 `np.dstack`：深度堆叠

np.dstack 沿着深度方向（轴 2）连接数组。这通常用于图像处理，其中每个数组代表一个颜色通道（如红、绿、蓝）。

函数签名：

python numpy.dstack(tup)

参数：

tup：需要堆叠的数组序列。除了轴 2 之外，这些数组在其他维度上必须具有相同的形状。

示例：

```python
import numpy as np

创建两个二维数组（模拟两个颜色通道）

red = np.array([[1, 2], [3, 4]])
green = np.array([[5, 6], [7, 8]])

深度堆叠

image = np.dstack((red, green))
print(image)

输出：

[[[1 5]

[2 6]]

[[3 7]

[4 8]]]

print(image.shape) # (2, 2, 2) - (height, width, channels)
```

np.dstack 的结果可以看作是将多个二维数组沿着深度方向“叠放”起来，形成一个三维数组。

1.6 `np.concatenate`：通用连接

np.concatenate 是最灵活的连接函数，它沿着指定的现有轴连接数组序列。np.hstack、np.vstack 和 np.dstack 都可以用 np.concatenate 来实现。

函数签名：

python numpy.concatenate(arrays, axis=0, out=None)

参数：

arrays：需要连接的数组序列。除了指定的连接轴之外，这些数组在其他维度上必须具有相同的形状。
axis：指定沿着哪个轴进行连接，默认为 0。
out：可选参数，用于指定输出数组。

示例：

```python
import numpy as np

创建两个一维数组

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

沿着轴 0 连接（等同于 np.vstack）

c = np.concatenate((a, b), axis=0)
print(c) # [1 2 3 4 5 6]

创建两个二维数组

arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])

沿着轴 0 连接（等同于 np.vstack）

concatenated_0 = np.concatenate((arr1, arr2), axis=0)
print(concatenated_0)

[[1 2]

[3 4]

[5 6]

[7 8]]

沿着轴 1 连接（等同于 np.hstack）

concatenated_1 = np.concatenate((arr1, arr2), axis=1)
print(concatenated_1)

[[1 2 5 6]

[3 4 7 8]]

```

np.concatenate 提供了最大的灵活性，可以沿着任意现有轴进行连接。

2. NumPy Stack 的应用场景

掌握了 NumPy 的 stack 函数族后，您可以在各种数据处理和分析任务中灵活运用它们：

数据整合： 将来自不同来源或不同时间段的数据合并成一个统一的数据集。例如，将多个 CSV 文件中的数据按行或列拼接起来。
特征工程： 将多个特征向量组合成一个特征矩阵，用于机器学习模型的训练。
图像处理： 将多个颜色通道（如 RGB）合并成一个完整的图像数组，或者将多个图像拼接成一个大的图像。
深度学习： 构建神经网络模型时，可能需要将多个层的输出堆叠起来，作为下一层的输入。
时间序列分析： 将多个时间序列数据沿着时间轴连接起来，进行联合分析。
构建高维数组：在需要生成特定维度和形状的数据时，stack可以按需扩展现有数组。

3. NumPy Stack 的性能考虑

虽然 NumPy 的 stack 函数族非常方便，但在处理大型数组时，需要注意性能问题：

内存复制： stack 函数通常会创建新的数组，并将原始数组的数据复制到新数组中。这意味着会占用额外的内存空间，并且复制操作本身也需要时间。
避免循环： 在循环中使用 stack 函数可能会导致性能急剧下降，因为每次迭代都会创建新的数组。如果可能，尽量使用一次 stack 操作来完成整个数组的堆叠。
out参数的使用：如果预先知道输出数组的大小，可以使用out参数来指定一个预先分配的数组，避免重复创建数组。

优化建议：

预分配内存： 如果您知道最终数组的大小，可以预先创建一个空的数组，然后使用切片或索引操作将数据填充到相应的位置，而不是使用 stack 函数。
选择合适的函数： 根据具体的堆叠需求，选择最合适的函数。例如，如果只是沿着水平或垂直方向堆叠，使用 np.hstack 或 np.vstack 通常比 np.concatenate 更高效。
利用广播机制：如果有可能，尽量利用 NumPy 的广播机制来避免显式的数组堆叠操作。

4. 总结与进阶

本文详细介绍了 NumPy 的 stack 函数族，包括 np.stack、np.hstack、np.vstack、np.dstack 和 np.concatenate。通过掌握这些函数，您可以轻松地实现数组的维度扩展，灵活地处理各种数据。

要点回顾：

np.stack 沿着新轴连接数组，增加维度。
np.hstack 沿着水平方向（轴 1）连接数组。
np.vstack 沿着垂直方向（轴 0）连接数组。
np.dstack 沿着深度方向（轴 2）连接数组。
np.concatenate 沿着指定的现有轴连接数组。

进阶学习：

NumPy 广播机制： 深入理解 NumPy 的广播机制，可以更高效地进行数组运算，避免不必要的数组复制和堆叠。
数组切片和索引： 熟练掌握数组的切片和索引操作，可以更灵活地操作数组，实现更复杂的数据处理任务。
内存视图（Memory Views）： 了解 NumPy 的内存视图机制，可以在不复制数据的情况下操作数组，提高性能。
其他数组操作函数： 探索 NumPy 提供的其他数组操作函数，如 np.reshape、np.transpose、np.expand_dims 等，进一步提升数组处理能力。

通过不断学习和实践，您将能够熟练运用 NumPy 进行各种数据处理和分析任务，成为数据科学领域的专家。

作者：admin

链接：https://hostlocvps.com/2025/03/24/%e6%8e%8c%e6%8f%a1numpy-stack%ef%bc%9a%e8%bd%bb%e6%9d%be%e5%ae%9e%e7%8e%b0%e6%95%b0%e7%bb%84%e7%9a%84%e7%bb%b4%e5%ba%a6%e6%89%a9%e5%b1%95/

文章版权归作者所有，未经允许请勿转载。

THE END

Xbox Series S游戏体验：真实玩家反馈

<<上一篇

掌握React setState：从入门到精通

下一篇>>

掌握Numpy Stack：轻松实现数组的维度扩展

掌握 NumPy Stack：轻松实现数组的维度扩展

1. NumPy Stack 基础

1.1 什么是数组堆叠？

1.2 np.stack：创建新维度

创建两个一维数组

沿着新的轴 0 堆叠（默认）

输出：

[[1 2 3]

[4 5 6]]

沿着新的轴 1 堆叠

输出：

[[1 4]

[2 5]

[3 6]]

创建两个二维数组

沿轴 0 堆叠

[[[1 2]

[3 4]]

[[5 6]

[7 8]]]

沿轴 1 堆叠

[[[1 2]

[5 6]]

[[3 4]

[7 8]]]

沿轴 2 堆叠

[[[1 5]

[2 6]]

[[3 7]

[4 8]]]

使用负轴索引

(2, 2, 2)

[[[1 5]

[2 6]]

[[3 7]

[4 8]]]

1.3 np.hstack：水平堆叠

创建两个一维数组

水平堆叠

输出：[1 2 3 4 5 6]

创建两个二维数组

水平堆叠

[[1 2 5 6]

[3 4 7 8]]

1.4 np.vstack：垂直堆叠

创建两个一维数组

垂直堆叠（注意：一维数组会被视为行向量）

输出：

[[1 2 3]

[4 5 6]]

创建两个二维数组

垂直堆叠

[[1 2]

[3 4]

[5 6]

[7 8]]

1.5 np.dstack：深度堆叠

创建两个二维数组（模拟两个颜色通道）

深度堆叠

输出：

[[[1 5]

[2 6]]

[[3 7]

[4 8]]]

1.6 np.concatenate：通用连接

创建两个一维数组

沿着轴 0 连接（等同于 np.vstack）

创建两个二维数组

沿着轴 0 连接（等同于 np.vstack）

[[1 2]

[3 4]

[5 6]

[7 8]]

沿着轴 1 连接（等同于 np.hstack）

[[1 2 5 6]

[3 4 7 8]]

2. NumPy Stack 的应用场景

3. NumPy Stack 的性能考虑

4. 总结与进阶

1.2 `np.stack`：创建新维度

1.3 `np.hstack`：水平堆叠

1.4 `np.vstack`：垂直堆叠

1.5 `np.dstack`：深度堆叠

1.6 `np.concatenate`：通用连接