Redis数据结构：原理、使用及最佳实践

2025-2-11

Redis 数据结构：原理、使用及最佳实践

Redis (REmote DIctionary Server) 是一个开源的、内存中的数据结构存储系统，它可以用作数据库、缓存和消息中间件。Redis 的高性能很大程度上归功于其丰富的数据结构。本文将深入探讨 Redis 的核心数据结构，包括它们的原理、使用场景和最佳实践。

1. 字符串 (String)

原理：

Redis 的字符串是二进制安全的，这意味着它可以存储任何类型的数据，例如文本、序列化的对象，甚至是图像。
Redis 字符串是动态字符串（SDS, Simple Dynamic String），与 C 语言的字符串相比，SDS 具有以下优势：
- O(1) 时间复杂度获取字符串长度： SDS 内部维护了 len 属性，记录字符串长度。
- 防止缓冲区溢出： SDS 会在修改字符串之前检查可用空间，如果空间不足，会自动扩展。
- 减少内存重新分配次数： SDS 使用空间预分配和惰性空间释放策略，优化内存使用。
- 二进制安全： SDS 使用 len 属性而不是空字符 \0 来判断字符串结尾，因此可以存储包含 \0 的数据。

使用场景：

缓存： 缓存热点数据，例如用户信息、配置信息、文章内容等。
计数器： 利用 Redis 的原子性操作（如 INCR、DECR）实现计数器功能，例如文章浏览量、点赞数等。
分布式锁： 使用 SETNX (SET if Not eXists) 命令实现简单的分布式锁。
Session 共享： 将用户 Session 信息存储在 Redis 中，实现分布式 Session 共享。

最佳实践：

键名设计： 使用有意义的、易于理解的键名，例如 user:123:name、article:456:views。避免使用过长的键名，以减少内存占用。
值大小控制： 尽量避免存储过大的字符串值，建议将大对象拆分成多个小对象存储，或者使用其他数据结构（如 Hash）。
过期时间： 为缓存数据设置合理的过期时间，使用EXPIRE 或 SETEX命令，以避免内存无限增长。
批量操作： 使用 MGET、MSET 等批量操作命令，减少网络开销，提高性能。

常用命令：

SET key value：设置键值对。
GET key：获取键对应的值。
INCR key：将键的值加 1。
DECR key：将键的值减 1。
SETNX key value：如果键不存在，则设置键值对。
EXPIRE key seconds：设置键的过期时间（秒）。
SETEX key seconds value: 设置键值对, 并设置过期时间(秒).
MGET key1 key2 ...：批量获取多个键的值。
MSET key1 value1 key2 value2 ...：批量设置多个键值对。
APPEND key value: 将值追加到现有值得末尾

2. 哈希 (Hash)

原理：

Redis Hash 是一个键值对集合，其中键和值都是字符串。
Hash 类似于一个小型的 Redis 数据库，适合存储对象。
Redis Hash 内部使用两种编码方式：
- ziplist (压缩列表)： 当 Hash 中的元素数量较少且每个元素的值都较小时，Redis 使用 ziplist 编码，以节省内存。
- hashtable (哈希表)： 当 Hash 中的元素数量较多或存在较大的值时，Redis 会将 ziplist 转换为 hashtable 编码，以提高查找效率。

使用场景：

存储对象： 将对象的多个属性存储在一个 Hash 中，例如用户信息（姓名、年龄、邮箱等）、商品信息（名称、价格、库存等）。
缓存： 缓存对象的多个属性，减少数据库查询次数。

最佳实践：

字段名设计： 使用简洁明了的字段名，例如 name、age、email。
字段数量控制： 尽量避免在一个 Hash 中存储过多的字段，建议将大对象拆分成多个 Hash 存储。
批量操作： 使用 HMGET、HMSET 等批量操作命令，减少网络开销。

常用命令：

HSET key field value：设置 Hash 中指定字段的值。
HGET key field：获取 Hash 中指定字段的值。
HMSET key field1 value1 field2 value2 ...：批量设置 Hash 中多个字段的值。
HMGET key field1 field2 ...：批量获取 Hash 中多个字段的值。
HGETALL key：获取 Hash 中所有字段和值。
HDEL key field1 field2 ...：删除 Hash 中一个或多个字段。
HEXISTS key field: 检查字段是否在Hash中存在
HINCRBY key field increment: 将Hash中字段的值增加increment

3. 列表 (List)

原理：

Redis List 是一个有序的字符串列表，按照插入顺序排序。
List 的底层实现是双向链表，这意味着在列表的两端插入和删除元素非常快（O(1) 时间复杂度），但根据索引访问元素较慢（O(n) 时间复杂度）。
Redis 3.2 版本之后，List 的底层实现改为 quicklist。quicklist 是 ziplist 和 linkedlist 的结合体，它将多个 ziplist 通过双向指针连接起来，既保留了 ziplist 节省内存的特性，又避免了 ziplist 在修改操作时可能导致的连锁更新问题。

使用场景：

消息队列： 使用 LPUSH 和 RPOP 命令实现简单的消息队列。
最新列表： 例如新闻 feed、博客文章列表，按照发布时间排序。
任务队列： 将任务添加到 List 中，工作进程从 List 中取出任务执行。

最佳实践：

长度控制： 避免在 List 中存储过多的元素，以免影响性能。
阻塞操作： 使用 BLPOP、BRPOP 等阻塞操作命令，实现消费者-生产者模型。
范围操作： 使用 LRANGE 命令获取 List 的一部分元素，避免一次性获取整个列表。

常用命令：

LPUSH key value1 value2 ...：将一个或多个值插入到列表头部。
RPUSH key value1 value2 ...：将一个或多个值插入到列表尾部。
LPOP key：移除并返回列表头部的元素。
RPOP key：移除并返回列表尾部的元素。
LRANGE key start stop：获取列表指定范围内的元素。
LINDEX key index：获取列表指定索引的元素。
LLEN key: 获取列表长度
BLPOP key1 key2 ... timeout：阻塞式地移除并返回多个列表头部的元素。
BRPOP key1 key2 ... timeout：阻塞式地移除并返回多个列表尾部的元素。

4. 集合 (Set)

原理：

Redis Set 是一个无序的、不重复的字符串集合。
Set 的内部实现是 hashtable 或 intset：
- intset (整数集合)： 当 Set 中的元素都是整数且数量较少时，Redis 使用 intset 编码，以节省内存。
- hashtable (哈希表)： 当 Set 中的元素包含非整数或数量较多时，Redis 会将 intset 转换为 hashtable 编码。

使用场景：

标签： 给用户或文章添加标签，方便查找和分类。
共同好友： 计算两个用户的共同好友。
唯一 ID 集合： 例如存储网站的独立访客 IP 地址。
黑名单/白名单： 存储 IP 地址黑名单或白名单。

最佳实践：

成员唯一性： 利用 Set 的成员唯一性，避免重复数据。
集合运算： 使用 SINTER、SUNION、SDIFF 等命令进行集合运算，例如求交集、并集、差集。

常用命令：

SADD key member1 member2 ...：向集合添加一个或多个成员。
SMEMBERS key：获取集合中的所有成员。
SISMEMBER key member：判断成员是否在集合中。
SREM key member1 member2 ...：从集合中移除一个或多个成员。
SINTER key1 key2 ...：计算多个集合的交集。
SUNION key1 key2 ...：计算多个集合的并集。
SDIFF key1 key2 ...：计算多个集合的差集。
SCARD key: 获取集合的成员数量

5. 有序集合 (Sorted Set / ZSet)

原理：

Redis Sorted Set 是一个有序的、不重复的字符串集合。
Sorted Set 中的每个成员都关联一个分数（score），Redis 根据分数对成员进行排序。
Sorted Set 的内部实现是 skiplist (跳跃表) 和 hashtable 的结合：
- hashtable： 存储成员到分数的映射，用于快速查找成员的分数。
- skiplist： 按照分数排序成员，用于快速范围查找和排序操作。
  - 跳表是一种概率性数据结构，在查找、插入、删除操作中可以获得对数级别的平均时间复杂度。
  - Redis的跳表在标准的跳表之上，进行了一些修改，以满足自身需求

使用场景：

排行榜： 例如游戏积分排行榜、热门文章排行榜。
带权重的任务队列： 根据任务的优先级排序。
延时队列： 使用分数作为时间戳，实现延时任务。

最佳实践：

分数设计： 合理设计分数，例如可以使用时间戳、积分、权重等。
范围操作： 使用 ZRANGE、ZREVRANGE 等命令根据分数范围获取成员。
排名操作： 使用 ZRANK、ZREVRANK 等命令获取成员的排名。

常用命令：

ZADD key score1 member1 score2 member2 ...：向有序集合添加一个或多个成员。
ZRANGE key start stop [WITHSCORES]：获取有序集合指定范围内的成员（按分数从小到大）。
ZREVRANGE key start stop [WITHSCORES]：获取有序集合指定范围内的成员（按分数从大到小）。
ZRANGEBYSCORE key min max [WITHSCORES] [LIMIT offset count]：获取有序集合分数在指定范围内的成员。
ZRANK key member：获取成员在有序集合中的排名（从小到大）。
ZREVRANK key member：获取成员在有序集合中的排名（从大到小）。
ZSCORE key member：获取成员的分数。
ZREM key member1 member2 ...：从有序集合中移除一个或多个成员。
ZCOUNT key min max: 获取有序集合中, 分数在min和max之间的成员数量
ZINCRBY key increment member: 将有序集合中成员的分数增加 increment

总结

Redis 提供了丰富的数据结构，每种数据结构都有其独特的特性和适用场景。理解这些数据结构的原理、使用场景和最佳实践，可以帮助我们更好地利用 Redis 解决实际问题，构建高性能、可扩展的应用。

除了本文介绍的五种基本数据结构，Redis 还提供了其他高级数据结构，例如 Bitmaps、HyperLogLogs、Geospatial indexes、Streams 等，它们在特定场景下可以发挥重要作用。随着 Redis 的不断发展，新的数据结构和功能也在不断涌现，持续学习和探索 Redis 的最新特性，可以让我们更好地掌握这个强大的工具。

作者：admin

链接：https://hostlocvps.com/2025/02/11/redis%e6%95%b0%e6%8d%ae%e7%bb%93%e6%9e%84%ef%bc%9a%e5%8e%9f%e7%90%86%e3%80%81%e4%bd%bf%e7%94%a8%e5%8f%8a%e6%9c%80%e4%bd%b3%e5%ae%9e%e8%b7%b5/

文章版权归作者所有，未经允许请勿转载。

THE END

XAMPP服务器搭建：本地测试PHP项目的最佳选择

<<上一篇

如何使用ReactRouterV7进行路由管理（完整示例）

下一篇>>