分享

Redis系统入门介绍

yuwenge 发表于 2015-7-3 23:00:53 [显示全部楼层] 只看大图 回帖奖励 阅读模式 关闭右栏 0 14356
本帖最后由 yuwenge 于 2015-7-3 23:17 编辑

问题导读
1.Redis数据类型有哪些?
2.本文使用Redis完成哪些功能?
3.Redis中什么是散列类型?






学会如何安装和运行Redis,并了解Redis的基础知识后,本章将详细介绍Redis的5种主要数据类型及相应的命令,带领读者真正进入Redis的世界。在学习的时候,手边打开一个redis-cli程序来跟着一起输入命令将会极大地提高学习效率。尽管在目前多数公司和团队的Redis的应用是以缓存和队列为主。
在之后的章节中你会遇到两个学习伙伴:小白和宋老师。小白是一个标准的极客,最近刚开始他的Redis学习之旅,而他大学时的计算机老师宋老师恰好对Redis颇有研究,于是就顺理成章地成为了小白的私人Redis教师。这不,小白想基于Redis开发一个博客,于是找到宋老师,向他请教。在本章中宋老师会向小白介绍Redis最核心的内容—数据类型,从他们的对话中你一定能学到不少知识!
3.2节到3.6节这5节将分别介绍Redis的5种数据类型,其中每节都是由4个部分组成,依次是“介绍”、“命令”、“实践”和“命令拾遗”。“介绍”部分是对数据类型的概述,“命令”部分会对“实践”部分将用到的命令进行介绍,“实践”部分会讲解该数据类型在开发中的应用方法,“命令拾遗”部分会对该数据类型其他比较有用的命令进行补充介绍。

3.1 热身
在介绍Redis的数据类型之前,我们先来了解几个比较基础的命令作为热身,赶快打开redis-cli,跟着样例亲自输入命令来体验一下吧!
1.获得符合规则的键名列表
[mw_shl_code=bash,true]KEYS pattern[/mw_shl_code]


pattern支持glob风格通配符格式,具体规则如表3-1所示。
表3-1 glob风格通配符规则
符 号含  义
?匹配一个字符
*匹配任意个(包括0个)字符
[]匹配括号间的任一字符,可以使用“-”符号表示一个范围,如a[b-d]可以匹配“ab”、“ac”和“ad”
\x匹配字符x,用于转义符号。如要匹配“?”就需要使用\?
现在Redis中空空如也(如果你从第2章开始就一直跟着本书的进度输入命令,此时数据库中可能还会有个foo键),为了演示KEYS命令,首先我们得给Redis加点料。使用SET命令(会在3.2节介绍)建立一个名为bar的键:

[mw_shl_code=bash,true]redis> SET bar 1
OK[/mw_shl_code]

然后使用KEYS *就能获得Redis中所有的键了(当然由于数据库中只有一个bar键,所以KEYS ba*或者KEYS bar等命令都能获得同样的结果):
[mw_shl_code=bash,true]redis> KEYS *
1) "bar"[/mw_shl_code]

注意

KEYS命令需要遍历Redis中的所有键,当键的数量较多时会影响性能,不建议在生产环境中使用。

提示

Redis不区分命令大小写,但在本书中均会使用大写字母表示Redis命令。

2.判断一个键是否存在

[mw_shl_code=bash,true]EXISTS key[/mw_shl_code]

如果键存在则返回整数类型1,否则返回0。例如:
[mw_shl_code=bash,true]redis> EXISTS bar
(integer) 1
redis> EXISTS noexists
(integer) 0[/mw_shl_code]


3.删除键
[mw_shl_code=bash,true]DEL key [key …][/mw_shl_code]


可以删除一个或多个键,返回值是删除的键的个数。例如:

[mw_shl_code=bash,true]redis> DEL bar
(integer) 1
redis> DEL bar
(integer) 0[/mw_shl_code]

第二次执行DEL命令时因为bar键已经被删除了,实际上并没有删除任何键,所以返回0。
技巧

DEL命令的参数不支持通配符,但我们可以结合Linux的管道和xargs命令自己实现删除所有符合规则的键。比如要删除所有以“user:”开头的键,就可以执行redis-cli KEYS "user:*"|xargs redis-cli DEL。

另外由于DEL命令支持多个键作为参数,所以还可以执行redis-cli DEL``redis-cli KEYS "user:*"* 来达到同样的效果,但是性能更好。*

4.获得键值的数据类型
[mw_shl_code=bash,true]TYPE
key[/mw_shl_code]


TYPE命令用来获得键值的数据类型,返回值可能是string(字符串类型)、hash(散列类型)、list(列表类型)、set(集合类型)、zset(有序集合类型)。例如:

[mw_shl_code=bash,true]redis
> SET foo 1
OK
redis> TYPE foo
string
redis> LPUSH bar 1
(integer) 1
redis> TYPE bar
list[/mw_shl_code]

LPUSH命令的作用是向指定的列表类型键中增加一个元素,如果键不存在则创建它,3.4节会详细介绍。

3.2 字符串类型
作为一个爱造轮子的资深极客,小白每次看到自己博客最下面的“Powered by WordPress”{![即“由WordPress驱动”。WordPress是一个开源的博客程序,用户可以借其通过简单的配置搭建一个博客或内容管理系统。]}都觉得有些不舒服,终于有一天他下定决心要开发一个属于自己的博客。但是用腻了MySQL数据库的小白总想尝试一下新技术,恰好上次参加Node Party时听人介绍过Redis数据库,便想着趁机试一试。可小白只知道Redis是一个键值对数据库,其他的一概不知。抱着试一试的态度,小白找到了自己大学时教计算机的宋老师,一问之下欣喜地发现宋老师竟然对Redis颇有研究。宋老师有感于小白的好学,决定给小白开个小灶。
小白:
宋老师您好,我最近听别人介绍过Redis,当时就对它很感兴趣。恰好最近想开发一个博客,准备尝试一下它。有什么能快速学会Redis的方法吗?
宋老师笑着说:
心急吃不了热豆腐,要学会Redis就要先掌握Redis的键值数据类型和相关的命令,这些内容是Redis的基础。为了让你更全面地了解Redis的每种数据类型,接下来我会先讲解如何将Redis作为数据库使用,但是实际上Redis可不只是数据库这么简单,更多的公司和团队将Redis用作缓存和队列系统,而这部分内容等你掌握了Redis的基础后我会再进行介绍。作为开始,我先来讲讲Redis中最基本的数据类型—字符串类型。


3.2.1 介绍
字符串类型是Redis中最基本的数据类型,它能存储任何形式的字符串,包括二进制数据。你可以用其存储用户的邮箱、JSON 化的对象甚至是一张图片。一个字符串类型键允许存储的数据的最大容量是512 MB{![ Redis的作者考虑过让字符串类型键支持超过 512 MB大小的数据,未来的版本也可能会放宽这一限制,但无论如何,考虑到Redis的数据是使用内存存储的,512 MB的限制已经非常宽松了。]}。
字符串类型是其他4种数据类型的基础,其他数据类型和字符串类型的差别从某种角度来说只是组织字符串的形式不同。例如,列表类型是以列表的形式组织字符串,而集合类型是以集合的形式组织字符串。学习过本章后面几节后相信读者对此会有更深的理解。


3.2.2 命令

1.赋值与取值[mw_shl_code=bash,true]SET key value
GET key[/mw_shl_code]

SET和GET是Redis中最简单的两个命令,它们实现的功能和编程语言中的读写变量相似,如key = "hello"在Redis中是这样表示的:


[mw_shl_code=bash,true]redis>
SET key hello
OK[/mw_shl_code]


想要读取键值则更简单:
[mw_shl_code=bash,true]redis>
GET key
"hello"[/mw_shl_code]
当键不存在时会返回空结果。
为了节约篇幅,同时避免读者过早地被编程语言的细节困扰,本书大部分章节将只使用redis-cli进行命令演示(必要的时候会配合伪代码),第5章会专门介绍在各种编程语言(PHP、Python、Ruby和Node.js)中使用Redis的方法。

不过,为了能让读者提前对Redis命令在实际开发时的用法有一个直观的体会,这里会先使用PHP实现一个SET/GET命令的示例网页:用户访问示例网页时程序会通过GET命令判断Redis中是否存储了用户的姓名,如果有则直接将姓名显示出来(如图3-1所示),如果没有则会提示用户填写(如图3-2所示),用户单击“提交”按钮后程序会使用SET命令将用户的姓名存入到Redis中。
image1.png
图3-1 设置过姓名时的页面
image2.png
图3-2 没有设置过姓名时的页面
代码如下:
[mw_shl_code=html,true]<?php
// 加载Predis库的自动加载函数
require './predis/autoload.php';

// 连接Redis
$redis= new Predis\Client(array(
  'host'   => '127.0.0.1',
  'port'   => 6379
));

// 如果提交了姓名则使用SET命令将姓名写入到Redis中
if ($_GET['name']) {
  $redis->set('name', $_GET['name']);
}

// 通过GET命令从Redis中读取姓名
$name = $redis->get('name');
?>
<!DOCTYPE html>

<html>
  <head>
    <meta charset="utf-8" />
    <title>我的第一个Redis程序</title>
  </head>
  <body>
   <?php if ($name): ?>
    <p>您的姓名是:<?php echo $name; ?></p>
   <?php else: ?>
    <p>您还没有设置姓名。</p>
   <?php endif; ?>
   <hr />
   <h1>更改姓名</h1>
   <form>
    <p>
     <label for="name">您的姓名:</label>
     <input type="text" name="name" id="name" />
    </p>
    <p>
     <button type="submit">提交</button>
    </p>
   </form>
  </body>
</html>[/mw_shl_code]

在这个例子中我们使用PHP的Redis客户端库Predis与Redis通信。5.1节会专门介绍Predis,有兴趣的读者可以先跳到5.1节查看Predis的安装方法来实际运行这个例子。

Redis的其他命令也可以使用Predis通过同样的方式调用,如马上要介绍的INCR命令的调用方法是$redis->incr(键名)。


2.递增数字
INCR key前面说过字符串类型可以存储任何形式的字符串,当存储的字符串是整数形式时,Redis提供了一个实用的命令
`INCR`,其作用是让当前键值递增,并返回递增后的值,用法为:


[mw_shl_code=bash,true]redis> INCR num
(integer) 1
redis> INCR num
(integer) 2
[/mw_shl_code]

当要操作的键不存在时会默认键值为0,所以第一次递增后的结果是1。当键值不是整数时Redis会提示错误:


[mw_shl_code=bash,true]redis> SET foo lorem
OK
redis> INCR foo
(error) ERR value is not an integer or out of range[/mw_shl_code]

有些读者会想到可以借助`GET`和`SET`两个命令自己实现`incr`函数,伪代码如下:


[mw_shl_code=bash,true]def incr($key)
  $value = GET $key
  if not $value
      $value = 0
  $value = $value + 1
  SET $key, $value
  return $value[/mw_shl_code]
如果Redis同时只连接了一个客户端,那么上面的代码没有任何问题(其实还没有加入错误处理,不过这并不是此处讨论的重点)。可当同一时间有多个客户端连接到Redis时则有可能出现竞态条件(race condition){![竞态条件是指一个系统或者进程的输出,依赖于不受控制的事件的出现顺序或者出现时机。]}。例如有两个客户端A和B都要执行我们自己实现的incr函数并准备将同一个键的键值递增,当它们恰好同时执行到代码第二行时二者读取到的键值是一样的,如“5”,而后它们各自将该值递增到“6”并使用SET命令将其赋给原键,结果虽然对键执行了两次递增操作,最终的键值却是“6”而不是预想中的“7”。包括INCR在内的所有Redis命令都是原子操作(atomic operation){![原子操作取“原子”的“不可拆分”的意思,原子操作是最小的执行单位,不会在执行的过程中被其他命令插入打断。]},无论多少个客户端同时连接,都不会出现上述情况。之后我们还会介绍利用事务(4.1节)和脚本(第6章)实现自定义的原子操作的方法。





3.2.3 实践

1.文章访问量统计
博客的一个常见的功能是统计文章的访问量,我们可以为每篇文章使用一个名为post:文章ID:page.view的键来记录文章的访问量,每次访问文章的时候使用INCR命令使相应的键值递增。
提示

Redis对于键的命名并没有强制的要求,但比较好的实践是用“对象类型:对象ID:对象属性”来命名一个键,如使用键user:1:friends来存储ID为1的用户的好友列表。对于多个单词则推荐使用“.”分隔,一方面是沿用以前的习惯(Redis以前版本的键名不能包含空格等特殊字符),另一方面是在redis-cli中容易输入,无需使用双引号包裹。另外为了日后维护方便,键的命名一定要有意义,如u:1:f的可读性显然不如user:1:friends好(虽然采用较短的名称可以节省存储空间,但由于键值的长度往往远远大于键名的长度,所以这部分的节省大部分情况下并不如可读性来得重要)。

2.生成自增ID
那么怎么为每篇文章生成一个唯一ID呢?在关系数据库中我们通过设置字段属性为AUTO_INCREMENT来实现每增加一条记录自动为其生成一个唯一的递增ID的目的,而在Redis中可以通过另一种模式来实现:对于每一类对象使用名为对象类型(复数形式):count{![这个键名只是参考命名,实际应用中可以使用任何容易理解的名称。]}的键(如users:count)来存储当前类型对象的数量,每增加一个新对象时都使用INCR命令递增该键的值。由于使用INCR命令建立的键的初始键值是1,所以可以很容易得知,INCR命令的返回值既是加入该对象后的当前类型的对象总数,又是该新增对象的ID。
3.存储文章数据
由于每个字符串类型键只能存储一个字符串,而一篇博客文章是由标题、正文、作者与发布时间等多个元素构成的。为了存储这些元素,我们需要使用序列化函数(如PHP中的serialize和JavaScript中的JSON.stringify)将它们转换成一个字符串。除此之外因为字符串类型键可以存储二进制数据,所以也可以使用MessagePack进行序列化,速度更快,占用空间也更小。
至此我们已经可以写出发布新文章时与Redis操作相关的伪代码首先获得新文章的ID
[mw_shl_code=bash,true]$postID

= INCR posts:count


alert("Hello CSDN");


将博客文章的诸多元素序列化成字符串
$serializedPost = serialize($title, $content, $author, $time)
把序列化后的字符串存一个入字符串类型的键中
SET post:$postID:data, $serializedPost文章数据的伪代码如下(以访问ID为42的文章为例):

Redis中读取文章数据
$serializedPost = GET post:42:data
将文章数据反序列化成文章的各个元素
$title, $content, $author, $time = unserialize($serializedPost)
获取并递增文章的访问数量

$count = INCR post:42:page.view[/mw_shl_code]
除了使用序列化函数将文章的多个元素存入一个字符串类型键中外,还可以对每个元素使用一个字符串类型键来存储,这种方法会在3.3.3节讨论。
3.2.4 命令拾遗

1.增加指定的整数
INCRBY key increment
alert(“Hello CSDN”);
[mw_shl_code=bash,true]`INCRBY`命令与`INCR`命令基本一样,只不过前者可以通过`increment`参数指定一次增加的数值,如:


redis> INCRBY bar 2
(integer) 2
redis> INCRBY bar 3
(integer) 5

alert("Hello CSDN");[/mw_shl_code]

2.减少指定的整数
[mw_shl_code=bash,true]DECR
key[/mw_shl_code]
[mw_shl_code=bash,true]DECRBY
key decrement[/mw_shl_code]

DECR命令与INCR命令用法相同,只不过是让键值递减,例如:
[mw_shl_code=bash,true]redis> DECR bar
(
integer) 4[/mw_shl_code]
而DECRBY命令的作用不用介绍想必读者就可以猜到,DECRBY key 5相当于INCRBY key –5。

3.增加指定浮点数
[mw_shl_code=bash,true]INCRBYFLOAT
key increment[/mw_shl_code]
INCRBYFLOAT命令类似INCRBY命令,差别是前者可以递增一个双精度浮点数,如:
[mw_shl_code=bash,true]redis> INCRBYFLOAT bar
2.7
"6.7"
redis> INCRBYFLOAT bar 5E+4
"50006.69999999999999929"[/mw_shl_code]

4.向尾部追加值
[mw_shl_code=bash,true]APPEND key
value[/mw_shl_code]
APPEND作用是向键值的末尾追加value。如果键不存在则将该键的值设置为value,即相当于SET key value。返回值是追加后字符串的总长度。如:
[mw_shl_code=bash,true]redis>
SET key hello
OK
redis> APPEND key " world!"
(integer) 12[/mw_shl_code]
此时key的值是"hello world!"。APPEND命令的第二个参数加了双引号,原因是该参数包含空格,在redis-cli中输入需要双引号以示区分。
5.获取字符串长度[mw_shl_code=bash,true]STRLEN
key[/mw_shl_code]
STRLEN命令返回键值的长度,如果键不存在则返回0。例如:
[mw_shl_code=bash,true]redis> STRLEN
key
(integer) 12
redis> SET key 你好
OK
redis> STRLEN key
(integer) 6[/mw_shl_code]

前面提到了字符串类型可以存储二进制数据,所以它可以存储任何编码的字符串。例子中Redis接收到的是使用UTF-8编码的中文,由于“你”和“好”两个字的UTF-8编码的长度都是3,所以此例中会返回6。

6.同时获得/设置多个键值


[mw_shl_code=bash,true]MGET
key [key …][/mw_shl_code]

[mw_shl_code=bash,true]MSET key
value [key value …][/mw_shl_code]
MGET/MSET与GET/SET相似,不过MGET/MSET可以同时获得/设置多个键的键值。例如:[mw_shl_code=bash,true]redis> MSET key1 v1 key2 v2 key3 v3
OK
redis>
GET key2
"v2"
redis> MGET key1 key3
1) "v1"
2) "v3"[/mw_shl_code]






7.位操作


[mw_shl_code=bash,true]GETBIT key
offset[/mw_shl_code]


[mw_shl_code=bash,true]SETBIT key
offset value[/mw_shl_code]




[mw_shl_code=bash,true]BITCOUNT

key [start] [end][/mw_shl_code]


[mw_shl_code=bash,true]BITOP operation destkey
key [key …][/mw_shl_code]


一个字节由8个二进制位组成,Redis提供了4个命令可以直接对二进制位进行操作。为了演示,我们首先将foo键赋值为bar:
[mw_shl_code=bash,true]redis>
SET foo bar
OK[/mw_shl_code]
bar的3个字母“b”“a”和“r”对应的ASCII码分别为98、97和114,转换成二进制后分别为1100010、1100001和1110010,所以foo键中的二进制位结构如图3-3所示。

image3.png

图3-3 bar的二进制存储结构

GETBIT命令可以获得一个字符串类型键指定位置的二进制位的值(0或1),索引从0开始:


[mw_shl_code=bash,true]redis> GETBIT foo
0
(integer) 0
redis> GETBIT foo 6
(integer) 1[/mw_shl_code]


如果需要获取的二进制位的索引超出了键值的二进制位的实际长度则默认位值是0:

[mw_shl_code=bash,true]redis> GETBIT foo
100000
(integer) 0[/mw_shl_code]
SETBIT命令可以设置字符串类型键指定位置的二进制位的值,返回值是该位置的旧值。如我们要将foo键值设置为aar,可以通过位操作将foo键的二进制位的索引第6位设为0,第7位设为1:

[mw_shl_code=bash,true]redis> SETBIT foo
6 0
(integer) 1
redis> SETBIT foo 7 1
(integer) 0
redis> GET foo
"aar"[/mw_shl_code]
如果要设置的位置超过了键值的二进制位的长度,SETBIT命令会自动将中间的二进制位设置为0,同理设置一个不存在的键的指定二进制位的值会自动将其前面的位赋值为0:

[mw_shl_code=bash,true]redis> SETBIT nofoo
10 1
(integer) 0
redis> GETBIT nofoo 5
(integer) 0[/mw_shl_code]
BITCOUNT命令可以获得字符串类型键中值是1的二进制位个数,例如:

[mw_shl_code=bash,true]redis> BITCOUNT foo
(
integer) 10[/mw_shl_code]
可以通过参数来限制统计的字节范围,如我们只希望统计前两个字节(即”aa“):

[mw_shl_code=bash,true]redis> BITCOUNT foo
0 1
(integer) 6[/mw_shl_code]
BITOP命令可以对多个字符串类型键进行位运算,并将结果存储在destkey参数指定的键中。BITOP命令支持的运算操作有AND、OR、XOR和NOT。如我们可以对bar和aar进行OR运算:

[mw_shl_code=bash,true]redis>
SET foo1 bar
OK
redis> SET foo2 aar
OK
redis> BITOP OR res foo1 foo2
(integer) 3
redis> GET res
"car"[/mw_shl_code]
运算过程如图3-4所示。


3_4.png


{-:-}图3-4 OR运算过程示意

Redis 2.8.7引入了BITPOS命令,可以获得指定键的第一个位值是0或者1的位置。还是以“bar”这个键值为例,如果想获取键值中的第一个二进制位为1的偏移量,则可以执行:

[mw_shl_code=bash,true]redis>
SET foo bar
OK
redis> BITPOS foo 1
(integer) 1[/mw_shl_code]
结合图3-3可以看出,正如BITPOS命令的结果所示,“bar”中的第一个值为1的二进制位的偏移量为1(同其他命令一样,BITPOS命令的索引也是从0开始算起)。那么有没有可能指定二进制位的查询范围呢?BITPOS命令的第二个和第三个参数分别可以用来指定要查询的起始字节(同样从0开始算起)和结束字节。注意这里的单位不再是二进制位,而是字节。如果我们想查询第二个字节到第三个字节之间(即“a”和“r”)出现的第一个值为1的二进制位的偏移量,则可以执行:

[mw_shl_code=bash,true]redis> BITPOS foo
1 1 2
(integer) 9[/mw_shl_code]
这里的返回结果的偏移量是从头开始算起的,与起始字节无关。另外要特别说明的一个有趣的现象是如果不设置结束字节且键值的所有二进制位都是1,则当要查询值为0的二进制位偏移量时,返回结果会是键值长度的下一个字位的偏移量。这是因为Redis会认为键值长度之后的二进制位都是0。

利用位操作命令可以非常紧凑地存储布尔值。比如如果网站的每个用户都有一个递增的整数ID,如果使用一个字符串类型键配合位操作来记录每个用户的性别(用户ID作为索引,二进制位值1和0表示男性和女性),那么记录100万个用户的性别只需占用100 KB多的空间,而且由于GETBIT和SETBIT的时间复杂度都是O(1),所以读取二进制位值性能很高。

注意

使用SETBIT命令时,如果当前键的键值长度小于要设置的二进制位的偏移量时,Redis会自动分配内存并将键值的当前长度到指定的偏移量之间的二进制位都设置为0。如果要分配的内存过大,则很可能会造成服务器的暂时阻塞而无法接收同一时间的其他请求。举例而言,在一台2014年的MacBook Pro笔记本上,设置偏移量232-1的值(即分配500 MB的内存)需要耗费将近1秒的时间。分配过大的偏移量除了会造成服务器阻塞,还会造成空间浪费。还是举刚才存储网站用户性别的例子,如果这个网站的用户ID是从100000001开始的,那么会造成10多MB的浪费,正确的做法是给每个用户的ID减去100000000再进行存储。

3.3 散列类型
小白只用了半个多小时就把访问统计和发表文章两个部分做好了。同时借助Bootstrap框架,老师花了一小会儿时间教会了之前只涉猎过HTML的小白如何做出一个像样的网页界面。
接着小白发问:
接下来我想要做的功能是博客的文章列表页,我设想在列表页中每个文章只显示标题部分,可是使用您刚才介绍的方法,若想取得文章的标题,必须把整个文章数据字符串取出来反序列化,而其中占用空间最大的文章内容部分却是不需要的,这样难道不会在传输和处理时造成资源浪费吗?
老师有些惊喜地看着小白答道:“很对!”同时以一个夸张的幅度点了下头,接着说:
这正是我接下来准备讲的。不仅取数据时会有资源浪费,在修改数据时也会有这个问题,比如当你只想更改文章的标题时也不得不把整个文章数据字符串更新一遍。
没等小白再问,老师就又继续说道:
前面我说过Redis的强大特性之一就是提供了多种实用的数据类型,其中的散列类型可以非常好地解决这个问题。
3.3.1 介绍
我们现在已经知道Redis是采用字典结构以键值对的形式存储数据的,而散列类型(hash)的键值也是一种字典结构,其存储了字段(field)和字段值的映射,但字段值只能是字符串,不支持其他数据类型,换句话说,散列类型不能嵌套其他的数据类型。一个散列类型键可以包含至多2***32***&#8722;1个字段。
提示

除了散列类型,Redis 的其他数据类型同样不支持数据类型嵌套。比如集合类型的每个元素都只能是字符串,不能是另一个集合或散列表等。

散列类型适合存储对象:使用对象类别和ID构成键名,使用字段表示对象的属性,而字段值则存储属性值。例如要存储ID为2的汽车对象,可以分别使用名为color、name和price的3个字段来存储该辆汽车的颜色、名称和价格。存储结构如图3-5所示。

image4.png
图3-5 使用散列类型存储汽车对象的结构图
回想在关系数据库中如果要存储汽车对象,存储结构如表3-2所示。
表3-2 关系数据库存储汽车资料的表结构
[td]
IDcolornameprice
1黑色宝马100万
2白色奥迪90万
3蓝色宾利600万
数据是以二维表的形式存储的,这就要求所有的记录都拥有同样的属性,无法单独为某条记录增减属性。如果想为ID为1的汽车增加生产日期属性,就需要把数据表更改为如表3-3所示的结构。
表3-3 为其中一辆汽车增加一个“属性”
[td]
IDcolornamepricedate
1黑色宝马100万2012年12月21日
2白色奥迪90万
3蓝色宾利600万
对于ID为2和3的两条记录而言date字段是冗余的。可想而知当不同的记录需要不同的属性时,表的字段数量会越来越多以至于难以维护。而且当使用ORM{![即Object-Relational Mapping(对象关系映射)。]}将关系数据库中的对象实体映射成程序中的实体时,修改表的结构往往意味着要中断服务(重启网站程序)。为了防止这些问题,在关系数据库中存储这种半结构化数据还需要额外的表才行。
而Redis的散列类型则不存在这个问题。虽然我们在图3-5中描述了汽车对象的存储结构,但是这个结构只是人为的约定,Redis并不要求每个键都依据此结构存储,我们完全可以自由地为任何键增减字段而不影响其他键。

3.3.2
命令

1.赋值与取值

[mw_shl_code=bash,true]HSET key field value
HGET key field
HMSET key field value [field value …]
HMGET key field [field …]
HGETALL key[/mw_shl_code]


HSET命令用来给字段赋值,而HGET命令用来获得字段的值。用法如下:


[mw_shl_code=bash,true]redis> HSET car price 500
(integer) 1
redis> HSET car name BMW
(integer) 1
redis> HGET car name
"BMW"[/mw_shl_code]

命令的方便之处在于不区分插入和更新操作,这意味着修改数据时不用事先判断字段是否存在来决定要执行的是插入操作(update)还是更新操作(insert)。当执行的是插入操作时(即之前字段不存在)HSET命令会返回1,当执行的是更新操作时(即之前字段已经存在)HSET命令会返回0。更进一步,当键本身不存在时,HSET命令还会自动建立它。
提示
在Redis中每个键都属于一个明确的数据类型,如通过HSET命令建立的键是散列类型,通过SET命令建立的键是字符串类型等等。使用一种数据类型的命令操作另一种数据类型的键会提示错误:"ERR Operation against a key holding the wrong kind of value"{![并不是所有命令都是如此,比如SET命令可以覆盖已经存在的键而不论原来键是什么类型。]}。当需要同时设置多个字段的值时,可以使用HMSET命令。例如,下面两条语句
HSET key field1 value1HSET key field2 value2可以用HMSET命令改写成
HMSET key field1 value1 field2 value2相应地,HMGET命令可以同时获得多个字段的值:
redis> HMGET car price name1) "500"2) "BMW"如果想获取键中所有字段和字段值却不知道键中有哪些字段时(如3.3.1节介绍的存储汽车对象的例子,每个对象拥有的属性都未必相同)应该使用HGETALL命令。如:
redis> HGETALL car1) "price"2) "500"3) "name"4) "BMW"返回的结果是字段和字段值组成的列表,不是很直观,好在很多语言的Redis客户端会将 HGETALL的返回结果封装成编程语言中的对象,处理起来就非常方便了。例如,在Node.js中:
redis.hgetall("car", function (error, car) {  // hgetall方法的返回的值被封装成了JavaScript的对象  console.log(car.price);  console.log(car.name);});2.判断字段是否存在HEXISTS key fieldHEXISTS命令用来判断一个字段是否存在。如果存在则返回1,否则返回0(如果键不存在也会返回0)。
redis> HEXISTS car model(integer) 0redis> HSET car model C200(integer) 1redis> HEXISTS car model(integer) 13.当字段不存在时赋值

[mw_shl_code=bash,true]HSETNX key field value[/mw_shl_code]


HSETNX{![HSETNX中的“NX”表示“if **N**ot e**X**ists”(如果不存在)。]}命令与HSET命令类似,区别在于如果字段已经存在,HSETNX命令将不执行任何操作。其实现可以表示为如下伪代码:

[mw_shl_code=bash,true]def
hsetnx(
$key, $field, $value)
  $isExists = HEXISTS $key, $field
  if $isExists is 0
    HSET $key, $field, $value
    return 1
  else
    return 0[/mw_shl_code]
只不过HSETNX命令是原子操作,不用担心竞态条件。









4.增加数字

[mw_shl_code=bash,true]HINCRBY key field increment[/mw_shl_code]

上一节的命令拾遗部分介绍了字符串类型的命令INCRBY,HINCRBY命令与之类似,可以使字段值增加指定的整数。散列类型没有HINCR命令,但是可以通过HINCRBY key field 1来实现。
HINCRBY命令的示例如下:
[mw_shl_code=bash,true]redis> HINCRBY person score 60  
(integer) 60[/mw_shl_code]

之前person键不存在,HINCRBY命令会自动建立该键并默认score字段在执行命令前的值为“0”。命令的返回值是增值后的字段值。

5.删除字段


[mw_shl_code=bash,true]HDEL key field [field …][/mw_shl_code]

命令可以删除一个或多个字段,返回值是被删除的字段个数:
[mw_shl_code=bash,true]redis> HDEL car price
(integer) 1
redis> HDEL car price
(integer) 0[/mw_shl_code]


3.3.3 实践

1.存储文章数据
3.2.3节介绍了可以将文章对象序列化后使用一个字符串类型键存储,可是这种方法无法提供对单个字段的原子读写操作支持,从而产生竞态条件,如两个客户端同时获得并反序列化某个文章的数据,然后分别修改不同的属性后存入,显然后存入的数据会覆盖之前的数据,最后只会有一个属性被修改。另外如小白所说,即使只需要文章标题,程序也不得不将包括文章内容在内的所有文章数据取出并反序列化,比较消耗资源。
除此之外,还有一种方法是组合使用多个字符串类型键来存储一篇文章的数据,如图3-6所示。
3_6.png
{-:-}图3-6 使用多个字符串类型键存储一个对象
使用这种方法的好处在于无论获取还是修改文章数据,都可以只对某一属性进行操作,十分方便。而本章介绍的散列类型则更适合此场景,使用散列类型的存储结构如图3-7所示。
从图3-7可以看出使用散列类型存储文章数据比图3-6所示的方法看起来更加直观,也更容易维护(比如可以使用HGETALL命令获得一个对象的所有字段,删除一个对象时只需要删除一个键),另外存储同样的数据散列类型往往比字符串类型更加节约空间,具体的细节会在4.6节中介绍。


2.存储文章缩略名
使用过WordPress的读者可能会知道发布文章时一般需要指定一个缩略名(slug)来构成该篇文章的网址的一部分,缩略名必须符合网址规范且最好可以与文章标题含义相似,如“This Is A Great Post!”的缩略名可以为“this-is-a-great-post”。每个文章的缩略名必须是唯一的,所以在发布文章时程序需要验证用户输入的缩略名是否存在,同时也需要通过缩略名获得文章的ID。
image5.png
图3-7 使用一个散列类型键存储一个对象

我们可以使用一个散列类型的键slug.to.id来存储文章缩略名和ID之间的映射关系。其中字段用来记录缩略名,字段值用来记录缩略名对应的ID。这样就可以使用HEXISTS命令来判断缩略名是否存在,使用HGET命令来获得缩略名对应的文章ID了。

现在发布文章可以修改成如下代码:

[mw_shl_code=html,true]$postID
= INCR posts:count

# 判断用户输入的slug是否可用,如果可用则记录
$isSlugAvailable = HSETNX slug.to.id, $slug, $postID
if $isSlugAvailable is 0
  # slug已经用过了,需要提示用户更换slug,
  # 这里为了演示方便直接退出。
  exit

HMSET post:$postID, title, $title, content, $content, slug, $slug,...[/mw_shl_code]
这段代码使用了HSETNX命令原子地实现了HEXISTS和HSET两个命令以避免竞态条件。当用户访问文章时,我们从网址中得到文章的缩略名,并查询slug.to.id键来获取文章ID:

[mw_shl_code=html,true]$postID
= HGET slug.to.id,
$slug
if not $postID
  print 文章不存在
  exit

$post = HGETALL post:$postID
print 文章标题:$post.title[/mw_shl_code]
需要注意的是如果要修改文章的缩略名一定不能忘了修改slug.to.id键对应的字段。如要修改ID为42的文章的缩略名为newSlug变量的值:

# 判断新的slug是否可用,如果可用则记录

$isSlugAvailable = HSETNX slug.to.id, $newSlug, 42
if $isSlugAvailable is 0
  exit

# 获得旧的缩略名
$oldSlug = HGET post:42, slug
# 设置新的缩略名
HSET post:42, slug, $newSlug
# 删除旧的缩略名
HDEL slug.to.id, $oldSlug

3.3.4 命令拾遗
1.只获取字段名或字段值

[mw_shl_code=bash,true]HKEYS key

HVALS key[/mw_shl_code]
有时仅仅需要获取键中所有字段的名字而不需要字段值,那么可以使用HKEYS命令,就像这样:

[mw_shl_code=bash,true]redis> HKEYS car
1) "name"
2) "model"[/mw_shl_code]
HVALS命令与HKEYS命令相对应,HVALS命令用来获得键中所有字段值,例如:

[mw_shl_code=bash,true]redis> HVALS car
1) "BMW"
2) "C200"
[/mw_shl_code]


2.获得字段数量
HLEN
key
例如:

redis> HLEN car
(
integer) 2



3.4 列表类型
正当小白踌躇满志地写着文章列表页的代码时,一个很重要的问题阻碍了他的开发,于是他请来了宋老师为他讲解。
原来小白是使用如下流程获得文章列表的:
  •  读取posts:count键获得博客中最大的文章ID;
  •  根据这个ID来计算当前列表页面中需要展示的文章ID列表(小白规定博客每页只显示10篇文章,按照ID的倒序排列),如第n页的文章ID范围是从最大的文章ID - (n - 1) * 10"到"max(最大的文章ID - n * 10 + 1, 1)";
  •  对每个ID使用HMGET命令来获得文章数据。
对应的伪代码如下:
[mw_shl_code=bash,true]# 每页显示10篇文章

$postsPerPage = 10 
# 获得最后发表的文章ID
$lastPostID = GET posts:count
# $currentPage存储的是当前页码,第一页时$currentPage的值为1,依此类推
$start = $lastPostID - ($currentPage - 1) * $postsPerPage
$end = max($lastPostID - $currentPage * $postsPerPage + 1, 1)

# 遍历文章ID获取数据
for $i = $start down to $end
  # 获取文章的标题和作者并打印出来
  post = HMGET post:$i, title, author
  print $post[0]  # 文章标题
  print $post[1]  # 文章作者  [/mw_shl_code]

可是这种方式要求用户不能删除文章以保证 ID 连续,否则小白就必须在程序中使用EXISTS命令判断某个ID的文章是否存在,如果不存在则跳过。由于每删除一篇文章都会影响后面的页码分布,为了保证每页的文章列表都能正好显示10篇文章,不论是第几页,都不得不从最大的文章ID开始遍历来获得当前页面应该显示哪些文章。
小白摇了摇头,心想:“真是个灾难!”然后看向宋老师,试探地问道:“我想到了KEYS命令,可不可以使用KEYS命令获得所有以“post:”开头的键,然后再根据键名分页呢?”
宋老师回答道:“确实可行,不过KEYS命令需要遍历数据库中的所有键,出于性能考虑一般很少在生产环境中使用这个命令。至于你提到的问题,可以使用Redis的列表类型来解决。”

3.4.1 介绍
列表类型(list)可以存储一个有序的字符串列表,常用的操作是向列表两端添加元素,或者获得列表的某一个片段。
列表类型内部是使用双向链表(double linked list)实现的,所以向列表两端添加元素的时间复杂度为O(1),获取越接近两端的元素速度就越快。这意味着即使是一个有几千万个元素的列表,获取头部或尾部的10条记录也是极快的(和从只有20个元素的列表中获取头部或尾部的10条记录的速度是一样的)。
不过使用链表的代价是通过索引访问元素比较慢,设想在iPad mini发售当天有1000个人在三里屯的苹果店排队等候购买,这时苹果公司宣布为了感谢大家的排队支持,决定奖励排在第486位的顾客一部免费的iPad mini。为了找到这第486位顾客,工作人员不得不从队首一个一个地数到第486个人。但同时,无论队伍多长,新来的人想加入队伍的话直接排到队尾就好了,和队伍里有多少人没有任何关系。这种情景与列表类型的特性很相似。
这种特性使列表类型能非常快速地完成关系数据库难以应付的场景:如社交网站的新鲜事,我们关心的只是最新的内容,使用列表类型存储,即使新鲜事的总数达到几千万个,获取其中最新的100条数据也是极快的。同样因为在两端插入记录的时间复杂度是O(1),列表类型也适合用来记录日志,可以保证加入新日志的速度不会受到已有日志数量的影响。
借助列表类型,Redis还可以作为队列使用,4.4节会详细介绍。
与散列类型键最多能容纳的字段数量相同,一个列表类型键最多能容纳2***32***&#8722;1个元素。






没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条