Skip to content

Latest commit

 

History

History
148 lines (87 loc) · 6.06 KB

redis-protocol.md

File metadata and controls

148 lines (87 loc) · 6.06 KB

#协议

协议解析这章先以get a这样的一个命令作为例子讲解以方便理解。

Redis 的协议是纯文本协议,没有任何二进制,牺牲了效率,牺牲了解析代码量,但方便了诊断,方便理解。

由于是文本协议,你可以通过telnet发送命令给redis-server

与之不同的是通过redis-cli、利用api库发送的协议格式是更利于服务端解析的格式,对协议组装(常见的是长度放到前头,还有添加阿协议类型)。

#处理协议

Redis 的网络事件库,我们在前面的文章已经讲过,readQueryFromClient先从连接里中读取数据,先存储在c->querybuf里。

接下来函数processInputBuffer来解析querybuf,上面说过如果是telnet发送的裸协议数据是没有任何辅助信息,针对telnet的数据跳到 processInlineBuffer函数,而其他则通过函数processMultibulkBuffer来处理。

这两个函数的作用一样,解析querybuf的字符串,分解成多参数到argcargv里面,argc表示参数的个数,argv是个 Redis_object 的指针数组,每个指针指向一个redisObject, redisObject的ptr里存储具体的内容,对于”get a“的请求转化后,argc就是2,argv就是

    (gdb) p (char\*)(\*c->argv[0])->ptr
    $28 = 0x80ea5ec "get"
    (gdb) p (char*)(*c->argv[1])->ptr
    $26 = 0x80e9fc4 "a"

协议解析后就执行命令。processCommand首先调用lookupCommand找到get对应的函数。

getCommand 比较简单,通过另一个全局的 server.db 这个 hash table 来查找 key,并返回 Redis object ,然后通过 addReplyBulk 函数返回结果。

##Requests格式

    参数的个数 CRLF
    $第一个参数的长度CRLF
    第一个参数CRLF
    ...
    $第N个参数的长度CRLF
    第N个参数CRLF

例如在Redis_cli里键入get a,经过协议组装后的请求为

    2\r\n$3\r\nget\r\n$1\r\na\r\n

Reply格式

bulk replies

bulk replies 是以$打头消息体,格式$值长度\r\n值\r\n,一般的 get 命令返回的结果就是这种格式。

    Redis>get aaa

    $3\r\nbbb\r\n

对应的的处理函数 addReplyBulk

    addReplyBulkLen(c,obj);             //$3
    addReply(c,obj);
    addReply(c,shared.crlf);

error message

是以-ERR 打头的消息体,后面跟着出错的信息,以\r\n结尾,针对命令出错。

    Redis>d

    -ERR unknown command 'd'\r\n

处理的函数是 addReplyError

    addReplyString(c,"-ERR ",5);
    addReplyString(c,s,len);
    addReplyString(c,"\r\n",2);

integer reply

是以:打头,后面跟着数字和\r\n。

    Redis>incr a
    :2\r\n

处理函数是

    addReply(c,shared.colon);
    addReply(c,o);
    addReply(c,shared.crlf);

status reply

以+打头,后面直接跟状态内容和\r\n

    Redis>ping
    +PONG\r\n

处理函数是 addReplyStatus

    addReplyString(c,"+",1);            //+
    addReplyString(c,s,len);
    addReplyString(c,"\r\n",2);

这里要注意reply经过协议加工后,都会先保存在 c->buf 里,c->bufpos 表示 buf 的长度。待到事件分离器转到写出操作(sendReplyToClient)的时候,就把 c->buf 的内容写入到 fd 里,c->sentlen 表示写出长度。当 c->sentlen = c->bufpos 才算写完。

Multi-bulk

复合应答,对于sinter,config get,keys,zrangebyscore,slowlog,hgetall 这类函数通常需要返回多个值,这类消息结构与请求的格式一模一样。 这类回复的一个特点,只有命令函数执行结束后,才能准确的知道 replies 的个数。

lrangeCommand 为什么不在此列?我们知道 Redis 的双链表的头部保留了一个链表长度字段,所以 lrange 命令在遍历链表之前,就能准确的知道应答的个数。

为什么要使用 c->reply 这个链表存储返回的值,c—>buf 数组不能满足需求么,bulk repies 就是使用 c->buf 的。

replies 的个数放在协议的最前面。只有链表,哈希,集合,数组遍历完毕之后我们才能知道 replies 的个数,如果使用 c->buf,遍历完毕后需要产生一个新的字符串,写入 replies 个数,再 strcpy c->buf 到新的字符串。我们不知道内容有多大,所以这里数组实在不适合存储临时回包数据。

所以 redis 在此处对回包数据进行分段,每段为一个字符串对象,存储在 c->reply 链表的上,每个字符串最大为 REDIS_REPLY_CHUNK_BYTES。

步骤如下:

  • addDeferredMultiBulkLength 往 c->reply 链表尾部添加一个空的字符串对象,从此 addReply 不再往 c->buf 里写数据了,而是走到 addReply*ToList 等函数。

  • addReply*ToList

      tail = listNodeValue(listLast(c->reply));
                                 
      /* Append to this object when possible. */
      if (tail->ptr != NULL &&   
          sdslen(tail->ptr)+sdslen(o->ptr) <= REDIS_REPLY_CHUNK_BYTES)
      {                          
          c->reply_bytes -= zmalloc_size_sds(tail->ptr);
          tail = dupLastObjectIfNeeded(c->reply); 
          tail->ptr = sdscatlen(tail->ptr,o->ptr,sdslen(o->ptr));
          c->reply_bytes += zmalloc_size_sds(tail->ptr);      
      } else {                   
          incrRefCount(o);    
          listAddNodeTail(c->reply,o);
          c->reply_bytes += zmalloc_size_sds(o->ptr);  
      }
    

    找到链表最末尾的对象,因为回包都是字符串,所以肯定是 sds 字符串对象,判断现有长度和新增长度是否分段的上限?否,则继续写入这个对象。是,则链表尾部插入这个一个新的对象。

  • setDeferredMultiBulkLength 把 multi replies 的个数,写入 addDeferredMultiBulkLength 创建的字符串内部,然后再和链表下一个字符串内容进行结合,可以看到这里的内存拷贝最大就是 REDIS_REPLY_CHUNK_BYTES 字节。

      len->ptr = sdscatlen(len->ptr,next->ptr,sdslen(next->ptr));