Redis的五大数据类型的数据结构
阅读原文时间:2023年08月30日阅读:3

概述

  Redis底层有六种数据类型包括:简单动态字符串、双向链表、压缩列表、哈希表、跳表和整数数组。这六种数据结构五大数据类型关系如下:

  • String:简单动态字符串
  • List:双向链表、压缩列表
  • Hash:压缩列表、哈希表
  • Sorted Set:压缩列表、跳表
  • Set:哈希表、整数数组

          数据类型和底层数据结构对应关系

  每种数据结构特性不一样,操作时间也不一样。

        数据结构的时间复杂度

二、数据结构

  从上述图中可以知道,Redis的底层数据结构由简单动态字符串、双向链表、压缩列表、哈希表、跳表、整数数组组成,其中哈希表和整数数组基本上大家都很熟悉了,下面重点介绍一下其余的几种数据结构。

1、简单动态字符串(SDS)

  结构:alloc,len,buf

        简单动态字符串结构

  buf:字节数组,保存实际数据。为了表示字节数组的结束,Redis 会自动在数组最后加一个“\0”,这就会额外占用 1 个字节的开销。

  len:占 4 个字节,表示 buf 的已用长度。

  alloc:也占个 4 字节,表示 buf 的实际分配长度,一般大于 len。

  那么SDS与C字符串有什么区别呢?区别主要有如下两点:

  (1)获取字符串长度时间复杂度为O(1)

  (2)在修改字符串时,会先检查长度是否够长,不够会进行扩展,避免缓冲区溢出

2、链表

  Redis使用的是双向无环链表,并且具有以下几个特点:

  (1)双端:链表具有前置节点和后置节点的引用,获取这两个节点时间复杂度都为O(1)。

  (2)无环:表头节点的 prev 指针和表尾节点的 next 指针都指向 NULL,对链表的访问都是以 NULL 结束。

  (3)带链表长度计数器:通过 len 属性获取链表长度的时间复杂度为 O(1)。

  (4)多态:链表节点使用 void* 指针来保存节点值,可以保存各种不同类型的值。

3、压缩列表

  压缩列表(ziplist)是Redis为了节省内存而开发的,是由一系列特殊编码的连续内存块组成的顺序型数据结构,一个压缩列表可以包含任意多个节点(entry),每个节点可以保存一个字节数组或者一个整数值。压缩列表并不是对数据利用某种算法进行压缩,而是将数据按照一定规则编码在一块连续的内存区域,目的是节省内存。

压缩列表实际上类似于一个数组,数组中的每一个元素都对应保存一个数据。和数组不同的是,压缩列表在表头有三个字段 zlbytes、zltail 和 zllen,分别表示列表长度、列表尾的偏移量和列表中的 entry 个数;压缩列表在表尾还有一个 zlend,表示列表结束;

我们要查找定位第一个元素和最后一个元素,可以通过表头三个字段的长度直接定位,复杂度是 O(1)。而查找其他元素时,就没有这么高效了,只能逐个查找,此时的复杂度就是 O(N) 了。

          压缩表的查找过程

4、跳表

  跳表在链表的基础上,增加了多级索引,通过索引位置的几个跳转,实现数据的快速定位,时间复杂度为O(logN),比起链表,跳表的查询效率大大提高到了 O(logn)。

        跳表查找过程

三、Redis数据类型的基本数据结构

1、String(字符串)

1.1 String的内部结构

  redis没有直接使用C语言中的字符串表示,而是自己构建了一个字符串,名为 “简单动态字符串” (simple dynamic string , SDS)。其中,C语言中的字符串只是作为字符串面量(通常在无须对字符串值进行修改的地方使用)。

  String在结构上的实现类似于Java中的ArrayList(默认构造一个大小为10的初始数组),这是冗余分配内存的思想,也称为预分配;这种思想可以减少扩容带来的性能消耗。

              String的内部结构

1.2 String使用的数据编码

  存储数字的话,采用int类型的编码,如果是非数字的话,采用 raw 编码;

1.3 使用场景

  (1) 简单字符缓存

  (2) 分布式锁

  (3)计数功能——》计数服务

2、List(列表)

2.1 List的内部结构

  Redis的列表相当于Java语言中的LinkedList,它是一个双向链表数据结构(但是这个结构设计比较巧妙,后面会介绍),支持前后顺序遍历。链表结构插入和删除操作快,时间复杂度O(1),查询慢,时间复杂度O(n)。

                List的内部结构

2.2 List使用的数据编码

  字符串长度及元素个数小于一定范围使用 ziplist 编码,任意条件不满足,则转化为 linkedlist 编码。

2.3 使用场景

  (1)利用List实现栈、队列

  (2)redis做消息队列(不推荐使用redis做消息队列)

  (3)列表缓存

3、Hash(字典)

3.1 Hash的内部结构

  Redis的hash(字典)相当于Java语言中的HashMap,它是根据散列值分布的无序字典,内部的元素是通过键值对的方式存储。

  hash(字典)的实现与Java中的HashMap(JDK1.7)的结构也是一致的,它的数据结构也是数组+链表组成的二维结构,节点元素散列在数组上,如果发生hash碰撞则使用链表串联在数组节点上。

        Hash的内部结构

3.2 Hash使用的数据编码

  hash 对象保存的键值对内的键和值字符串长度小于一定值及键值对。

3.3 使用场景

  (1) 存储对象

4、Set(集合)

4.1 Set的内部结构

  Redis的set(集合)相当于Java语言里的HashSet,它内部的键值对是无序的、唯一的。它的内部实现了一个所有value为null的特殊字典。
集合中的最后一个元素被移除之后,数据结构被自动删除,内存被回收。

        Set的内部结构

4.2 Set使用的数据编码

  保存元素为整数及元素个数小于一定范围使用 intset 编码,任意条件不满足,则使用 hashtable 编码。

4.3 使用场景

  (1)标签,社交,查询有共同兴趣爱好的人,智能推荐

  (2)抽奖

  (3)朋友圈点赞

5、Zset(有序集合)

5.1 Zset的内部结构

  zset(有序集合)是Redis中最常问的数据结构。它类似于Java语言中的SortedSet和HashMap的结合体,它一方面通过set来保证内部value值的唯一性,另一方面通过value的score(权重)来进行排序。这个排序的功能是通过Skip List(跳跃列表)来实现的。zset(有序集合)的最后一个元素value被移除后,数据结构被自动删除,内存被回收。

        Zset的内部结构

5.2 Zset使用的数据编码

  zset 对象中保存的元素个数小于及成员长度小于一定值使用 ziplist 编码,任意条件不满足,则使用 skiplist 编码。

5.3 使用场景

  (1)排名场景