Redis的Pipeline、事务和lua
阅读原文时间:2023年07月09日阅读:1

1.1 Pipeline概念

  Redis客户端执行一条命令分别为如下4个过程:

1) 发送命令

2) 命令排队

3) 命令执行

4) 返回结果

  其中1)+4)称为Round Trip Time(RTT,往返时间)。

  Redis提供了批量操作命令(例如mget、mset等),有效地节约RTT。但大部分命令是不支持批量操作的,例如要执行n 次 hgetall命令,并没有mhgetall命令存在,需要消耗n次RTT。Redis的客户端和服务端可能部署在不同的机器上。例如客户端在北京,Redis服务端在上海,两地直线距离约为1300公里,那么1次 RTT时间=1300 x 2/ ( 300000 x 2/3 ) =13毫秒(光在真空中传输速度为每秒30万公里,这里假设光纤为光速的2/3),那么客户端在1秒内大约只能执行80次左右的命令,这个和Redis的高并发高吞吐特性背道而驰。

  Pipeline (流水线)机制能改善上面这类问题,它能将一组Redis命令进行组装,通过一次RTT传输给Redis, 再将这组 Redis命令的执行结果按顺序返回给客户端,图3-5为没有使用Pipeline执行了n条命令,整个过程需需要n次RTT。

  图3-6为使用Pipeline执行了n次命令,整个过程需要1次 RTT。

  Pipeline并不是什么新的技术或机制,很多技术上都使用过。而且RTT在不同网络环境下会有不同,例如同机房和同机器会比较快,跨机房跨地区会比较慢。Redis命令真正执行的时间通常在微秒级别,所以才会有Redis性能瓶颈是网络这样的说法。

  redis-cli的--pipe选项实际上就是使用Pipeline机制,例如下面操作将set hello world和incr counter两条命令组装:

echo -en ' *3\r\n$3\r\nSET\r\n$5\r\nhello\r\n$5\r\nworld\r\n*2\r\n$4\r\nincr\r\n$7\r\ncounter\r\n' | redis-cli --pipe

  但大部分开发人员更倾向于使用高级语言客户端中的Pipeline,目前大部分Redis客户端都支持Pipeline。

1.2 性能测试

  表3-1给出了在不同网络环境下非Pipeline和 Pipeline执行10000次 set操作的效果,可以得到如下两个结论:

□ Pipeline执行速度一般比逐条执行要快。

□ 客户端和服务端的网络延时越大,Pipeline的效果越明显。

表 3-1 在不同网络下,10000条set非Pipeline和 Pipeline的执行时间对比

网 络

延 迟

非 Pipeline

Pipeline

本机

0.17ms

573ms

134ms

内网服务器

0.41ms

1610ms

240ms

异地机房

7ms

78499ms

1104ms

1.3 原生批量命令与Pipeline对比

  可以使用Pipeline模拟出批量操作的效果,但是在使用时要注意它与原生批量命令的区别,具体包含以下几点:

口原生批量命令是原子的,Pipeline是非原子的。

口原生批量命令是一个命令对应多个key, Pipeline支持多个命令。

□原生批量命令是Redis服务端支持实现的,而 Pipeline需要服务端和客户端的共同实现。

1.4 最佳实践

  Pipeline虽然好用,但是每次Pipeline组装的命令个数不能没有节制,否则一次组装Pipeline数据量过大,一方面会增加客户端的等待时间,另一方面会造成一定的网络阻塞,可以将一次包含大量命令的Pipeline拆分成多次较小的Pipeline来完成。

  Pipeline只能操作一个Redis实例,但是即使在分布式Redis场景中,也可以作为批量操作的重要优化手段。

  为了保证多条命令组合的原子性,Redis提供了简单的事务功能以及集成Lua脚本来解决这个问题。本节首先简单介绍Redis中事务的使用方法以及它的局限性,之后重点介绍Lua语言的基本使用方法,以及如何将Redis和Lua脚本进行集成,最后给出Redis管理Lua脚本的相关命令。

2.1 事务

  熟悉关系型数据库的读者应该对事务比较了解,简单地说,事务表示一组动作,要么全部执行,要么全部不执行。例如在社交网站上用户A 关注了用户B, 那么需要在用户A 的关注表中加入用户B,并且在用户B 的粉丝表中添加用户A, 这两个行为要么全部执行,要么全部不执行,否则会出现数据不一致的情况。

  Redis提供了简单的事务功能,将一组需要一起执行的命令放到multi和exec两个命令之间。multi命令代表事务开始,exec命令代表事务结束,它们之间的命令是原子顺序执行的,例如下面操作实现了上述用户关注问题。

127.0.0.1:6379> multi
OK
127.0.0.1:6379> sadd user:a :follow user:b
QUEUED
127.0.0.1:6379> sadd user🅱️fans user:a
QUEUED

  可以看到sadd命令此时的返回结果是QUEUED, 代表命令并没有真正执行,而是暂时保存在Redis中。如果此时另一个客户端执行sismember user🅰️follow user:b 返回结果应该为0。

127.0.0.1:6379> sismember user🅰️follow user:b
(integer) 0

  只有当exec执行后,用户A 关注用户B 的行为才算完成,如下所示返回的两个结果对应 sadd命令。

127.0.0.1:6379> exec
1) (integer) 1
2) (integer) 1
127.0.0.1:6379> sismember user🅰️follow user:b
(integer) 1

  如果要停止事务的执行,可以使用discard命令代替exec命令即可。

127.0.0.1:6379> discard
OK
127.0.0.1:6379> sismember user🅰️follow user:b
(integer) 0

  如果事务中的命令出现错误,Redis的处理机制也不尽相同。

1.命令错误

  例如下面操作错将set写成了 sett, 属于语法错误,会造成整个事务无法执行,key和counter的值未发生变化.

127.0.0.1:6388> mget key counter
1) "hello "
2) "100 "
127.0.0.1:6388> multi
OK
127.0.0.1:6388> sett key world
(error) ERR unknown command ' sett'
127.0.0.1:6388> incr counter
QUEUED
127.0.0.1:6388> exec
(error) EXECABORT Transaction discarded because of previous errors.
127.0.0.1:6388> mget key counter
1) "hello "
2) "100

2.运行时错误

  例如用户B 在添加粉丝列表时,误把sadd命令写成了 zadd命令,这种就是运行时命令,因为语法是正确的:

127.0.0.1:6379> multi
OK
127.0.0.1:6379> sadd user🅰️follow user:b
QUEUED
127.0.0.1:6379> zadd user🅱️fans 1 user:a
QUEUED
127.0.0.1:6379> exec
1) (integer) 1
2) (error) WRONGTYPE Operation against a key holding the wrong kind of value
127.0.0.1:6379> sismember user🅰️follow user:b
(integer) 1

  可以看到Redis并不支持回滚功能,sadd user🅰️follow user:b命令已经执行成开发人员需要自己修复这类问题。

  有些应用场景需要在事务之前,确保事务中的key没有被其他客户端修改过,才执行事务,否则不执行(类似乐观锁)。Redis提供了 watch命令来解决这类问题,表 3-2展示两个客户端执行命令的时序。

表 3-2事务中 watch命令演示时序

时间点

客户端-1

客户端-2

T1

set key "java"

T2

watch key

T3

multi

T4

append key python

T5

append key jedis

T6

exec

T7

get key

  可以看到“客户端-1”执行multi之前执行了watch命令,“客户端-2”在“客户端-1”执行exec之前修改了key值,造成事务没有执行(exec结果为nil),整个代码如下所示:

#T1:客户端 1
127.0.0.1:6379 > set key "java"
OK
#T2:客户端 1
127.0.0.1:6379> watch key
OK
#T3:客户端 1
127.0.0.1:6379> multi
OK
#T4:客户端 2
127.0.0.1:6379> append key python
(integer) 11
#T5:客户端 1
127.0.0.1:6379> append key jedis
QUEUED
#T6:客户端 1
127.0.0.1:6379> exec
(nil)
#T7:客户端 1
127.0.0.1:6379> get key
"javapython"

  Redis提供了简单的事务,之所以说它简单,主要是因为它不支持事务中的回滚特性,同时无法实现命令之间的逻辑关系计算,当然也体现了 Redis的 “keep it simple”的特性,下一小节介绍的Lua脚本同样可以实现事务的相关功能,但是功能要强大很多。

2.2 Lua用法简述

  Lua语言是在1993年由巴西一个大学研究小组发明,其设计目标是作为嵌人式程序移植到其他应用程序,它是由C语言实现的,虽然简单小巧但是功能强大,所以许多应用都选用它作为脚本语言,尤其是在游戏领域,例如大名鼎鼎的暴雪公司将Lua语言引入到“魔兽世界”这款游戏中,Rovio公司将Lua语言作为“愤怒的小鸟”这款火爆游戏的关卡升级引擎,Web服务器Nginx将 Lua语言作为扩展,增强自身功能。Redis将 Lua作为脚本语言可帮助开发者定制自己的Redis命令,在这之前,必须修改源码。在介绍如何在Redis中使用Lua脚本之前,有必要对Lua语言的使用做一个基本的介绍。

1.数据类型及其逻辑处理

  Lua语言提供了如下几种数据类型:booleans (布尔)、numbers (数值)、strings (字符串)、tables(表格),和许多髙级语言相比,相对简单。下面将结合例子对Lua的基本数据类型和逻辑处理进行说明。

  (1) 字符串

  下面定义一个字符串类型的数据:

local strings val = "world"

  其中,local代表val是一个局部变量,如果没有local代表是全局变量。print函数可以打印出变量的值,例如下面代码将打印world, 其中是Lua语言的注释。

- - 结果是 "world"
print (hello)

(2) 数组

  在 Lua中,如果要使用类似数组的功能,可以用tables类型,下面代码使用定义了一个 tables类型的变量myArray,但和大多数编程语言不同的是,Lua的数组下标从1开始计算:

local tables myArray = {"redis", "jedis", true, 88.0}
—true
print(myArray[3])

  如果想遍历这个数组,可以使用for和 while, 这些关键字和许多编程语言是一致的。

  (a) for

  下面代码会计算1到 100的和,关键字for以 end作为结束符

local int sum = 0
for i = 1, 100
do
sum = sum + i
end

  • - 输出结果为 5050
    print(sum)

      要遍历myArray, 首先需要知道tables的长度,只需要在变量前加一个# 号即可:

for i = 1, #myArray
do
print(myArray[ i ])
end

  除此之外,Lua还提供了内置函数ipairs, 使用for index,value ipairs(tables)可以遍历出所有的索引下标和值。

for index,value in ipairs(myArray)
do
print(index)
print(value)
end

  (b) while

  下面代码同样会计算1到100的和,只不过使用的是While循环,while循环同样以end作为结束符。

local int sum = 0
local int i = 0
while i <= 100
do
sum = sum +i
i = i + 1
end

  • - 输出结果为 5050
    print(sum)

      (c) ifelse

      要确定数组中是否包含了jedis,有则打印true,注意if以end结尾,if后紧跟then:

local tables myArray = {" redis ", "jedis" , true, 88.0}
for i = 1, #myArray
do
if myArray[i] == "jedis"
then
print ( "true" )
break
else
--do nothing
end
end

(3) 哈希

  如果要使用类似哈希的功能,同样可以使用tables类型,例如下面代码定义了一个ta bles,每个元素包含了key和value,其中stringsl .. string2是将两个字符串进行连接:

local tables user_l = {age = 28, name = "tome"}
--user_1 age is 28
print ( "user_1 age is" .. user_1[ "age"])

  如果要遍历user_l,可以使用Lua的内置函数pairs:

for key, value in pairs (user_1)
do print(key .. value)
end

2.函数定义

  在Lua中,函数以function开头,以end结尾,funcName是函数名,中间部分是函数体:

function funcName()

end

  contact函数将两个字符串拼接:

function contact(str1, str2 )
return str1 .. str2
end

  • - " hello world"
    print (contact ( "hello", "world"))

2.3 Redis与Lua

1.在Redis中使用Lua

  在Redis中执行lua脚本有两种方法:eval和 evalsha。

  (1) eval

eval 脚本内容 key个数 key列表 参数列表

下面例子使用了key列表和参数列表来为Lua脚本提供更多的灵活性:

127.0.0.1:6379> eval 'return "hello "…KEYS[1] … ARGV[1]' 1 redis world
"hello redisworld"

  此时 KEYS[l]=”redis",ARGV[l]="world",所以最终的返回结果是"hello redis world"。

  如果Lua脚本较长,还可以使用 redis-cli--eval直接执行文件。

  eval 命令和--eval参数本质是一样的,客户端如果想执行Lua脚本,首先在客户端编写好Lua脚本代码,然后把脚本作为字符串发送给服务端,服务端会将执行结果返回给客户端,整个过程如图3-7所示。

  (2) evalsha

除了使用 eval, Redis 还提供了evalsha 命令来执行 Lua 脚本。如图 3-8 所示,首先要将Lua脚本加载到Redis服务端,得到该脚本的SHA1校验和 ,evalsha 命令使用 SHA1作为参数可以直接执行对应 Lua 脚本,避免每次发送 Lua 脚本的开销。这样客户端就不需要每次执行脚本内容,而脚本也会常驻在服务端,脚本功能得到了复用。

加载脚本:script load命令可以将脚本内容加载Redi内存中,例如下面将lua_get.lua 加载到 Redis中,得到SHA1为:”7413dc2440dblfea7c0a0bde841fa68eefafl49c"

# redis-cli script load " $ (cat lua_get.lua )"
"7413dc2440dblfea7c0a0bde841fa68eefaf149c"

执行脚本:evalsha的使用方法如下,参数使用SHAl值,执行逻辑和eval—致。

evalsha 脚本 SHA1 值 key 个数 key 列表 参数列表

  所以只需要执行如下操作,就可以调用lua_get.lua脚本:

127.0.0.1:6379> evalsha 7413dc2440dblfea7c0a0bde841fa68eefaf149c 1 redis world
"hello redisworld"

2.Lua的Redis API

  Lua可以使用redis.call函数实现Redis的访问,例如下面代码是Lua使用redis.ca ll调用了Redis的set和get操作:

redis.call ( "set" , "hello", "world")
redis.call ( "get", "hello" )

  放在Redis的执行效果如下:

127.0.0.1:6379> eval 'return redis.call ( "get", KEYS[1] )' 1 hello
"world"

  除此之外Lua还可以使用redis.pcall函数实现对Redis的调用,redis.call和red is.pcall的不同在于,如果redis.call执行失败,那么脚本执行结束会直接返回错误,而 redis.pcall会忽略错误继续执行脚本,所以在实际开发中要根据具体的应用场景进行函数的选择。

2.4 案例

  Lua脚本功能为Redis开发和运维人员带来如下三个好处:

口 Lua脚本在Redis中是原子执行的,执行过程中间不会插人其他命令。

□ Lua脚本可以帮助开发和运维人员创造出自己定制的命令,并可以将这些命令常驻在

  Redis内存中,实现复用的效果。

□ Lua脚本可以将多条命令一次性打包,有效地减少网络开销。

  下面以一个例子说明Lua脚本的使用,当前列表记录着热门用户的id, 假设这个列表有5个元素,如下所示:

127.0.0.1:6379> lrange hot:user:list 0 -1
1) "user:1:ratio"
2) "user:8:ratio"
3) "user:3:ratio"
4) "user:99:ratio"
5) "user:72:ratio"

  user:{id}:ratio代表用户的热度,它本身又是一个字符串类型的键:

127.0.0.1:6379> mget user:1:ratio user:8:ratio user:3:ratio user:99:ratio user:72:ratio
1) "986"
2) "762"
3) "w556"
4) "400"
5) "101"

  现要求将列表内所有的键对应热度做加1操作,并且保证是原子执行,此功能可以利用Lua脚本来实现。

1) 将列表中所有元素取出,赋值给mylist:

local mylist = redis.call ( "lrange", KEYS[1 ], 0, -1)

2) 定义局部变量count= 0,这个count就是最后incr的总次数:

local count = 0

3) 遍历mylist中所有元素,每次做完count自增,最后返回count:

for index,key in ipairs (mylist)
do
redis.call ( "incr" ,key)
count = count + 1
end
return count

  将上述脚本写人lrange_and_mincr.lua文件中,并执行如下操作,返回结果为5。

redis-cli --eval lrange_and_mincr.lua hot:user:list
(integer) 5

  执行后所有用户的热度自增1:

127.0.0.1:6379> mget user:1:ratio user:8:ratio user:3:ratio user:99:ratio user:72:ratio
1) "987"
2) "763"
3) "557"
4) "401"
5) "102

  本节给出的只是一个简单的例子,在实际开发中,开发人员可以发挥自己的想象力创造出更多新的命令。

2.5 Redis 如何管理Lua 脚本

  Redis提供了4个命令实现对Lua脚本的管理,下面分别介绍。

(1) script load

script load script

此命令用于将Lua脚本加载到Redis内存中,前面已经介绍并使用过了,这里不再赘述

(2) script exists

scripts exists sha1 [sha1 …]

  此命令用于判断shal是否已经加载到Redis内存中:

127.0.0.1:6379> script exists a5260dd66ce02462c5b5231c727b3f7772c0bcc5
1) (integer) 1

返回结果代表shal [shal …]被加载到Redis内存的个数。

(3) script flush

script flush

此命令用于清除Redis内存已经加载的所有Lua脚本,在执行script flush后,a5260dd66ce02462c5b5231c727b3f7772c0bcc5不再存在:

127.0.0.1:6379> script exists a5260dd66ce02462c5b5231c727b3f7772c0bcc5
1) (integer) 1
127.0.0.1:6379> script flush
OK
127.0.0.1:6379> script exists a5260dd66ce02462c5b5231c727b3f7772c0bcc5
1) (integer) 0

(4) script kill

此命令用于杀掉正在执行的Lua脚本。如果Lua脚本比较耗时,甚至Lua脚本存在问题,那么此时Lua脚本的执行会阻塞Redis, 直到脚本执行完毕或者外部进行干预将其结束。下面我们模拟一个Lua脚本阻塞的情况进行说明。

下面的代码会使Lua进人死循环:

while 1 == 1
do

end

执行Lua脚本,当前客户端会阻塞:

127.0.0.1:6379> eval 'while 1==1 do end' 0

Redis提供了一个lua-time -limit参数,默认是5 秒,它是Lua脚本的“超时时间”,但这个超时时间仅仅是当Lua脚本时间超过lua-time-limit后,向其他命令调用发送BUSY的信号,但是并不会停止掉服务端和客户端的脚本执行,所以当达到lua-time-limit值之后,其他客户端在执行正常的命令时,将会收到“ Busy Redis is busy running ascript”错误,并且提示使用script kill或者shutdown nosave命令来杀掉这个busy的脚本:

127.0.0.1:6379> get hello
(error) BUSY Redis is busy running a script . You can only call SCRIPT KILL or SHUTDOWN NOSAVE.

此时Redis已经阻塞,无法处理正常的调用,这时可以选择继续等待,但更多时候需要快速将脚本杀掉。使用shutdown save显然不太合适,所以选择script kill,当script

kill执行之后,客户端调用会恢复:

127.0.0.1:6379> script kill
OK
127.0.0.1:6379> get hello
"world"

但是有一点需要注意,如果当前Lua脚本正在执行写操作,那么script kill将不会生效。例如,我们模拟一个不停的写操作:

while 1==1
do
redis.call( "set" ,"k","v")
end

此时如果执行script kill,会收到如下异常信息:

(error) UNKILLABLE Sorry the script already executed write commands against the
dataset. You can either wait the script termination or kill the server in a
hard way using the SHUTDOWN NOSAVE command.

上面提示Lua脚本正在向Redis执行写命令,要么等待脚本执行结束要么使用shutdown save停掉Redis服务。可见Lua脚本虽然好用,但是使用不当破坏性也是难以想象的。