Redis

关注公众号 jb51net

关闭
首页 > 数据库 > Redis > redis数据编码

Redis数据编码详解

作者:czlczl20020925

这篇文章主要介绍了Redis数据编码的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
struct redisObject {
    unsigned type:4;       // [0-3 bit] 对象类型 (如 String)
    unsigned encoding:4;   // [4-7 bit] 编码方式 (如 int/embstr/raw)
    unsigned lru:24;       // [8-31 bit] 缓存淘汰数据
    int refcount;          // [32-63 bit] 引用计数 (4字节)
    void *ptr;             // [64-127 bit] 关键指针 (8字节)
};

String

在 Redis 的底层实现中,String(字符串) 类型并不只有一种形态。为了平衡“内存占用”与“处理性能”,Redis 会根据字符串的内容和长度,在 intembstrraw 三种编码方式之间自动切换。

这三种编码都封装在 redisObject 这个“外壳”下,通过 encoding 字段进行区分。

struct sdshdr8 {
    uint8_t len;    /* 已使用长度 */
    uint8_t alloc;  /* 总分配空间(不含头和 \0) */
    unsigned char flags; /* 类型标志(如 sdshdr8, sdshdr16 等) */
    char buf[];     /* 实际字节数组 */
};

1.int编码:直接存储整数

当一个字符串对象保存的是整数值,且这个整数可以用 long 类型(8 字节有符号整数)表示时,Redis 就会使用 int 编码。

2.embstr编码:嵌入式短字符串

当字符串的长度 小于等于 44 字节 时,Redis 使用 embstr 编码。这是为了极致压榨小对象的性能。

3.raw编码:常规长字符串

当字符串的长度 大于 44 字节,或者对 embstr 进行了修改操作时,Redis 会使用 raw 编码。

List

Redis3.2之前:ZipList/LinkedList

在 Redis 3.2 之前,List 的实现非常简单粗暴:当数据量小时使用 ZipList(压缩列表),通过连续内存压榨空间;当数据量大或字符串长时,直接转换为 LinkedList(双向链表),通过指针实现灵活增删,但代价是每个节点都要背负两个 8 字节指针的沉重负担,且内存碎片极多。

Redis3.2之后:QuickList

RedisObject中的*ptr指向quicklist对象

typedef struct quicklist {
    quicklistNode *head;      /* 指向头节点 */
    quicklistNode *tail;      /* 指向尾节点 */
    unsigned long count;      /* 所有元素总数 */
    unsigned long len;        /* 节点(车厢)总数 */
    int fill : 16;            /* 节点填充因子 */
    unsigned int compress : 16; /* 压缩深度 */
} quicklist;
typedef struct quicklistNode {
    struct quicklistNode *prev; /* 前驱指针 */
    struct quicklistNode *next; /* 后继指针 */
    unsigned char *zl;          /* 指向物理内存中的连续块 (ZipList/Listpack) */
    unsigned int sz;            /* 连续块占用的总字节数 */
    unsigned int count : 16;    /* 连续块包含的元素个数 */
    // ... 其他标志位
} quicklistNode;

Set

Redis 的 Set(集合) 编码设计同样遵循“从小到大”的进化逻辑。它在物理实现上主要在 IntSet(整数集合)Listpack(紧凑列表,Redis 7.2+)Hashtable(哈希表) 之间切换。

它的核心哲学是:如果全是小整数,我用数组排好序;如果有字符串,我用哈希表锁死。

1. 物理结构:intset(整数集合)

当集合满足以下 两个条件 时,Redis 优先使用 intset

  1. 集合内所有成员均为 整数
  2. 成员数量小于配置参数 set-max-intset-entries(默认 512 个)。

内存布局与查找逻辑

intset 是一块绝对连续的内存空间。

2. 物理结构:listpack(紧凑列表)

这是 Redis 7.2 引入的新物理层。在旧版本中,集合只要出现一个字符串就会立刻膨胀为 dict,而 listpack 充当了中间的缓冲带。

3. 物理结构:dict(字典 / 逻辑名称 HashTable)

当集合规模超过阈值,或包含长字符串时,Redis 会使用 dict 作为终极物理载体。

物理映射与内存布局

此时 redisObject->ptr 指向一个真实的 dict 结构体实例。

4. 宏观物理映射:RedisObject 的指向

对于 Set 来说,redisObject 的包装方式非常直观:

字段IntSet 编码Hashtable 编码
typeOBJ_SETOBJ_SET
encodingOBJ_ENCODING_INTSETOBJ_ENCODING_HT
ptr 指向一整块连续的 intset 结构一个复杂的 dict 字典结构

ZSet

Redis 的 ZSet(有序集合) 在底层编码上设计得最为复杂,因为它必须同时满足 O ( 1 ) O(1) O(1) 成员查分 O ( log ⁡ N ) O(\log N) O(logN) 按分数排序/范围检索 这两个核心需求。

其物理实现主要分为两个阶段:listpackdict + zskiplist

1. 紧凑阶段:listpack(紧凑列表)

当 ZSet 满足以下两个条件时,Redis 使用 listpack 编码(OBJ_ENCODING_LISTPACK):

  1. 成员数量小于 zset-max-listpack-entries(默认 128)。
  2. 所有成员字符串长度小于 zset-max-listpack-value(默认 64 字节)。

物理存储逻辑

listpack 内部,成员(Member)和分值(Score)被存储为两个相邻的 Entry

2. 进化阶段:zset结构体 (跳表 + 字典)

当数据量突破阈值后,redisObject->ptr 会指向一个专门的 zset 结构体。这是一个双重物理结构的组合:

typedef struct zset {
    dict *dict;          /* 成员 -> 分值的哈希表 */
    zskiplist *zsl;      /* 按分数排序的跳跃表 */
} zset;

A. 物理组件一:dict(字典)

B. 物理组件二:zskiplist(跳跃表)

3. 内存优化:SDS 的“引用共享”

你可能会担心:同一个成员既存在 dict 里,又存在 zskiplist 里,岂不是浪费了一倍内存?

物理真相
dict 的 Key 和 zskiplistNodeele 指向的是同一个物理内存地址(同一个 SDS 对象)。

4. 物理特性对比表

物理结构逻辑编码 (Encoding)核心优势算法复杂度内存特征
listpackLISTPACK极致节省内存O ( N ) O(N) O(N) (查找/插入)连续内存,无碎片
zset (复合)SKIPLIST全能性能查分 O ( 1 ) O(1) O(1),范围 O ( log ⁡ N ) O(\log N) O(logN)双重索引,指针较多

5. 状态转换逻辑

ZSet 的转换通常是单向不可逆的:

Hash

Redis 的 Hash(哈希) 结构在底层编码的设计上,逻辑与 ZSet 非常相似:在数据量小时采用紧凑的连续内存,在数据量大时进化为散列表。

目前的物理实现主要分为 listpackdict 两种。

1. 紧凑编码:listpack(紧凑列表)

当 Hash 结构满足以下两个条件时,Redis 使用 listpack 存储(编码名称为 OBJ_ENCODING_LISTPACK):

  1. 哈希中字段(Field)的数量小于 hash-max-listpack-entries(默认 512 个)。
  2. 所有字段名和值的长度都小于 hash-max-listpack-value(默认 64 字节)。

物理存储逻辑

listpack 的字节流中,Field 和 Value 是作为两个相邻的 Entry 存储的:

2. 散列编码:dict(字典)

一旦数据量突破阈值,或者某个 Value 太长,Redis 就会将物理结构转换为 dict(编码名称为 OBJ_ENCODING_HT)。

物理实现逻辑

此时 redisObject->ptr 指向一个真实的 dict 结构体:

到此这篇关于Redis数据编码详解的文章就介绍到这了,更多相关redis数据编码内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文