Redis Stream 实践

2018 年 7 月 21 日 性能与架构

1. 前言

redis 5 中有一个重大新特性:stream。

stream 是一个日志形式的存储结构,可以往里追加数据,每条数据都会生成一个时间戳ID,stream 也有便捷的读取数据的模型。

stream 的特性使其适合做消息队列和时间序列存储。

下面通过实践来深入了解stream,由于内容较长,我也准备了PDF版本,文章底部有下载地址。

2. 安装环境

需要使用最新的5.0版本,这里使用 docker redis 容器:

  
  
    
  1. docker run --name redis5 -p 6379:6379 -d redis:5.0-rc3

redis 客户端:

  
  
    
  1. docker run -it --link redis5:redis --rm redis redis-cli -h redis -p 6379

启动后进入交互命令行:

  
  
    
  1. redis:6379>

3. 实践

3.1 向stream添加元素

stream 元素可以是一个或多个键值对,添加:

  
  
    
  1. redis:6379> XADD mystream * sensor-id 1234 temperature 19.8

  2. 1531989605376-0

解析:

  • mystream 是 stream的key

  • * 所在位置的参数的含义是元素ID,* 表示由系统自动生成一个元素ID

  • 添加的元素包含2个键值对,sensor-id 1234 和 temperature 19.8

  • 返回值是新增元素的ID,由时间戳和递增数字构成

获取Stream中元素的数量:

  
  
    
  1. redis:6379> XLEN mystream

  2. (integer) 1

3.2 范围查询

需要指定起止ID,相当于给一个时间范围:

  
  
    
  1. redis:6379> XRANGE mystream 1531989605376 1531989605377

  2. 1) 1) 1531989605376-0

  3.   2) 1) "sensor-id"

  4.      2) "1234"

  5.      3) "temperature"

  6.      4) "19.8"

可以使用 - 代表最小ID, + 代表最大ID:

  
  
    
  1. redis:6379> XRANGE mystream - +

  2. 1) 1) 1531989605376-0

  3.   2) 1) "sensor-id"

  4.      2) "1234"

  5.      3) "temperature"

  6.      4) "19.8"

当返回元素太多时,可以限定返回结果数量,就像数据库查询时的分页,通过 COUNT 参数指定:

  
  
    
  1. redis:6379> XRANGE mystream - + COUNT 2

  2. 1) 1) 1531989605376-0

  3.   2) 1) "sensor-id"

  4.      2) "1234"

  5.      3) "temperature"

  6.      4) "19.8"

还可以反向查询,使用 XREVRANGE 命令即可,用法与 XRANGE 相同。

3.3 监听 stream 的新元素

  
  
    
  1. redis:6379> XREAD COUNT 2 STREAMS mystream 0

  2. 1) 1) "mystream"

  3.   2) 1) 1) 1531989605376-0

  4.         2) 1) "sensor-id"

  5.            2) "1234"

  6.            3) "temperature"

  7.            4) "19.8"

STREAMS 后面的 mystream 指定的是目标 stream 的 key, 0 是指最小的ID,就是获取指定stream中的大于指定ID的元素, COUNT 指获取的数量

可以一起指定多个stream,例如 STREAMS mystream otherstream00

阻塞监听

在客户端1中执行:

  
  
    
  1. redis:6379> XREAD BLOCK 0 STREAMS mystream $

会进入等待状态。

在客户端2中添加元素:

  
  
    
  1. redis:6379> XADD mystream * test 1

客户端1中会显示刚刚添加的元素:

  
  
    
  1. 1) 1) "mystream"

  2.   2) 1) 1) 1531994510562-0

  3.         2) 1) "test"

  4.            2) "1"

BLOCK 表示阻塞, 0 是指定超时时间,0 表示永不超时, $ 表示stream中的最大ID。

3.4 消费者组

当stream量很大,或者消费者处理过程比较耗时的时候,只有一个消费者的话压力就比较大了,redis stream 提供了消费者组的概念,可以让多个消费者处理同一个stream,可以实现负债均衡。

例如有3个消费者 C1、C2、C3,stream 中有7个消息元素,那么消费的分配就是:

  
  
    
  1. 1 -> C1

  2. 2 -> C2

  3. 3 -> C3

  4. 4 -> C1

  5. 5 -> C2

  6. 6 -> C3

  7. 7 -> C1

3.4.1 创建消费者组

  
  
    
  1. redis:6379> XGROUP CREATE mystream mygroup01 $

  2. OK

针对 mystream 这个 stream 创建了一个消费者组,名字为 mygroup01$ 表示读取目前最大ID之后的元素。

3.4.2 添加测试数据

添加几条新数据:

  
  
    
  1. redis:6379> XADD mystream * message apple

  2. 1531999977149-0

  3. redis:6379> XADD mystream * message orange

  4. 1531999980272-0

  5. redis:6379> XADD mystream * message strawberry

  6. 1531999983493-0

  7. redis:6379> XADD mystream * message apricot

  8. 1531999988458-0

  9. redis:6379> XADD mystream * message banana

  10. 1531999991782-0

3.4.3 通过消费者组读数据

  
  
    
  1. redis:6379> XREADGROUP GROUP mygroup01 Alice COUNT 1 STREAMS mystream >

  2. 1) 1) "mystream"

  3.   2) 1) 1) 1531999977149-0

  4.         2) 1) "message"

  5.            2) "apple"

Alice 是组成员的名字,> 的含义是:到目前为止没有被组内成员读取过的数据。

可以看到,组成员不需要提前创建,第一次使用时自动创建。

下面再创建1个成员来读取数据:

  
  
    
  1. redis:6379> XREADGROUP GROUP mygroup01 Bob COUNT 1 STREAMS mystream >

  2. 1) 1) "mystream"

  3.   2) 1) 1) 1531999980272-0

  4.         2) 1) "message"

  5.            2) "orange"

3.4.4 消费历史

  
  
    
  1. redis:6379> XREADGROUP GROUP mygroup01 Alice STREAMS mystream 0

  2. 1) 1) "mystream"

  3.   2) 1) 1) 1531999977149-0

  4.         2) 1) "message"

  5.            2) "apple"

这里最后指定的ID是 0,这样可以拿到悬而未决的历史数据,就是:自己曾经消费过,但没有发送消费确认的历史数据,这样可以让我们做故障恢复后的完善工作。

3.4.5 消费确认

  
  
    
  1. redis:6379> XACK mystream mygroup01 1531999977149-0

  2. (integer) 1

1531999977149-0Alice 消费的那条 apple 数据,再查看下 Alice 的消费历史:

  
  
    
  1. redis:6379> XREADGROUP GROUP mygroup01 Alice STREAMS mystream 0

  2. 1) 1) "mystream"

  3.   2) (empty list or set)

已经空了。

3.4.6 失败处理

通过上面可以了解到,当某个消费者出现问题然后恢复了之后,可以拿到自己还没有确认过的消息数据,这个一个安全保障机制,但如果这个出问题的消费者再也恢复不了了怎么办?他的那些还没确认过的消息数据是不是就没办法处理了?

redis stream 提供了这种情况的处理办法,通过2个步骤来解决:

  1. 查出所有已传递但未确认的消息数据

  2. 变更这些数据的所有者

这样就可以让新的消费者来处理这些数据了。

列出未处理的数据:

  
  
    
  1. redis:6379> XPENDING mystream mygroup01 - + 10

  2. 1) 1) 1531999980272-0

  3.   2) "Bob"

  4.   3) (integer) 45126376

  5.   4) (integer) 2

  6. 2) 1) 1531999983493-0

  7.   2) "Tom"

  8.   3) (integer) 867475

  9.   4) (integer) 1

可以看到有2条数据未处理,列出了每条数据的 ID、所有者、此条消息的闲置时间(毫秒)、此消息被传递的次数。

声明变更所有者:

  
  
    
  1. redis:6379> XCLAIM mystream mygroup01 Gates 3600 1531999980272-0 1531999983493-0

  2. 1) 1) 1531999980272-0

  3.   2) 1) "message"

  4.      2) "orange"

  5. 2) 1) 1531999983493-0

  6.   2) 1) "message"

  7.      2) "strawberry"

把指定2个ID的消息给了Gates3600 是指最小闲置时间,就是把指定消息中闲置时间大于3600的分配给Gates,注意Gates是全新的消费者,之前没有声明过,说明分配给新的消费者也是可以的。

查询一下Gates现在未处理的数据:

  
  
    
  1. redis:6379> XREADGROUP GROUP mygroup01 Gates STREAMS mystream 0

  2. 1) 1) "mystream"

  3.   2) 1) 1) 1531999980272-0

  4.         2) 1) "message"

  5.            2) "orange"

  6.      2) 1) 1531999983493-0

  7.         2) 1) "message"

  8.            2) "strawberry"

可以看到新分配的2条数据。

3.5 查看 stream 相关信息

基本信息:

  
  
    
  1. redis:6379> XINFO STREAM mystream

  2. 1) length

  3. 2) (integer) 15

  4. 3) radix-tree-keys

  5. 4) (integer) 1

  6. 5) radix-tree-nodes

  7. 6) (integer) 2

  8. 7) groups

  9. 8) (integer) 2

  10. 9) first-entry

  11. 10) 1) 1531989605376-0

  12.    2) 1) "sensor-id"

  13.       2) "1234"

  14.       3) "temperature"

  15.       4) "19.8"

  16. 11) last-entry

  17. 12) 1) 1531999991782-0

  18.    2) 1) "message"

  19.       2) "banana"

消费组信息:

  
  
    
  1. redis:6379> XINFO GROUPS mystream

  2. 1) 1) name

  3.   2) "mygroup"

  4.   3) consumers

  5.   4) (integer) 3

  6.   5) pending

  7.   6) (integer) 5

  8. 2) 1) name

  9.   2) "mygroup01"

  10.   3) consumers

  11.   4) (integer) 4

  12.   5) pending

  13.   6) (integer) 2

某个组中消费者的信息:

  
  
    
  1. redis:6379> XINFO CONSUMERS mystream mygroup

  2. 1) 1) name

  3.   2) "Alice"

  4.   3) pending

  5.   4) (integer) 3

  6.   5) idle

  7.   6) (integer) 2483388

  8. 2) 1) name

  9.   2) "Bob"

  10.   3) pending

  11.   4) (integer) 2

  12.   5) idle

  13.   6) (integer) 48453755

  14. 3) 1) name

  15.   2) "Gates"

  16.   3) pending

  17.   4) (integer) 0

  18.   5) idle

  19.   6) (integer) 2385114

3.7 删除消息数据

先查一下现有数据:

  
  
    
  1. redis:6379> XRANGE mystream - + COUNT 2

  2. 1) 1) 1531989605376-0

  3.   2) 1) "sensor-id"

  4.      2) "1234"

  5.      3) "temperature"

  6.      4) "19.8"

  7. 2) 1) 1531994510562-0

  8.   2) 1) "test"

  9.      2) "1"

删除第一条数据:

  
  
    
  1. redis:6379> XDEL mystream 1531989605376-0

  2. (integer) 1

再次查看,之前的第一条数据已经没有了:

  
  
    
  1. redis:6379> XRANGE mystream - + COUNT 2

  2. 1) 1) 1531994510562-0

  3.   2) 1) "test"

  4.      2) "1"

  5. 2) 1) 1531994516257-0

  6.   2) 1) "test"

  7.      2) "2"

注意:XDEL 并不是真正的从内存中删除,只是做了标识,不会回收内存

3.8 设置stream最大长度

添加数据,同时指定了最大长度为2:

  
  
    
  1. redis:6379> XADD mystream MAXLEN 2 * value 1

  2. 1532049865028-0

  3. redis:6379> XADD mystream MAXLEN 2 * value 2

  4. 1532049872075-0

  5. redis:6379> XADD mystream MAXLEN 2 * value 3

  6. 1532049877554-0

上面添加了3条数据,下面看一下stream 的长度和现在的内容:

  
  
    
  1. redis:6379> XLEN mystream

  2. (integer) 2

  3. redis:6379> XRANGE mystream - +

  4. 1) 1) 1532049872075-0

  5.   2) 1) "value"

  6.      2) "2"

  7. 2) 1) 1532049877554-0

  8.   2) 1) "value"

  9.      2) "3"

可以看到只有2条数据。

4. 小结

以上就是 redis stream 的基础操作,实践一遍之后就会对 stream 有个全面的了解。

PDF 下载地址:

https://pan.baidu.com/s/1j91evQWfJHFxMXftTxSi6A


点击“阅读原文”可以查看文章列表

登录查看更多
3

相关内容

Redis 是一个使用 C 语言写成的,开源的 key-value 数据库。
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
162+阅读 · 2020年5月14日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
77+阅读 · 2020年4月24日
专知会员服务
110+阅读 · 2020年3月12日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
33+阅读 · 2020年1月10日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
96+阅读 · 2019年12月4日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
滴滴离线索引快速构建FastIndex架构实践
InfoQ
21+阅读 · 2020年3月19日
Cayley图数据库的可视化(Visualize)
Python开发者
5+阅读 · 2019年9月9日
漏洞预警丨Xstream远程代码执行漏洞
FreeBuf
4+阅读 · 2019年7月25日
Kali Linux 渗透测试:密码攻击
计算机与网络安全
16+阅读 · 2019年5月13日
PHP使用Redis实现订阅发布与批量发送短信
安全优佳
7+阅读 · 2019年5月5日
百度开源项目OpenRASP快速上手指南
黑客技术与网络安全
5+阅读 · 2019年2月12日
OLAP引擎这么多,为什么苏宁选择用Druid?
51CTO博客
12+阅读 · 2018年12月20日
Flink 靠什么征服饿了么工程师?
阿里技术
6+阅读 · 2018年8月13日
当ES赶超Redis,这份ES进修攻略不容错过!
DBAplus社群
3+阅读 · 2018年4月15日
Arxiv
5+阅读 · 2020年3月26日
Embedding Logical Queries on Knowledge Graphs
Arxiv
3+阅读 · 2019年2月19日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
VIP会员
相关VIP内容
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
162+阅读 · 2020年5月14日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
77+阅读 · 2020年4月24日
专知会员服务
110+阅读 · 2020年3月12日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
33+阅读 · 2020年1月10日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
96+阅读 · 2019年12月4日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
相关资讯
滴滴离线索引快速构建FastIndex架构实践
InfoQ
21+阅读 · 2020年3月19日
Cayley图数据库的可视化(Visualize)
Python开发者
5+阅读 · 2019年9月9日
漏洞预警丨Xstream远程代码执行漏洞
FreeBuf
4+阅读 · 2019年7月25日
Kali Linux 渗透测试:密码攻击
计算机与网络安全
16+阅读 · 2019年5月13日
PHP使用Redis实现订阅发布与批量发送短信
安全优佳
7+阅读 · 2019年5月5日
百度开源项目OpenRASP快速上手指南
黑客技术与网络安全
5+阅读 · 2019年2月12日
OLAP引擎这么多,为什么苏宁选择用Druid?
51CTO博客
12+阅读 · 2018年12月20日
Flink 靠什么征服饿了么工程师?
阿里技术
6+阅读 · 2018年8月13日
当ES赶超Redis,这份ES进修攻略不容错过!
DBAplus社群
3+阅读 · 2018年4月15日
Top
微信扫码咨询专知VIP会员