Skip to content

Latest commit

 

History

History
352 lines (321 loc) · 18.5 KB

Buffer模块.md

File metadata and controls

352 lines (321 loc) · 18.5 KB

为什么要有缓冲区的设计

TcpConnection 类负责处理一个新连接的事件,包括从客户端读取数据和向客户端写数据。但是在这之前,需要先设计好缓冲区。

  1. 非阻塞网络编程中应用层buffer是必须的:非阻塞IO的核心思想是避免阻塞在read()write()或其他I/O系统调用上,这样可以最大限度复用thread-of-control,让一个线程能服务于多个socket连接。I/O线程只能阻塞在IO-multiplexing函数上,如select()/poll()/epoll_wait()。这样一来,应用层的缓冲是必须的,每个TCP socket都要有inputBufferoutputBuffer
  2. TcpConnection必须有output buffer:使程序在write()操作上不会产生阻塞,当write()操作后,操作系统一次性没有接受完时,网络库把剩余数据则放入outputBuffer中,然后注册POLLOUT事件,一旦socket变得可写,则立刻调用write()进行写入数据。——应用层buffer到操作系统buffer
  3. TcpConnection必须有input buffer:当发送方send数据后,接收方收到数据不一定是整个的数据,网络库在处理socket可读事件的时候,必须一次性把socket里的数据读完,否则会反复触发POLLIN事件,造成busy-loop。所以网路库为了应对数据不完整的情况,收到的数据先放到inputBuffer里。——操作系统buffer到应用层buffer

Buffer缓冲区设计

muduo 的 Buffer 类作为网络通信的缓冲区,像是 TcpConnection 就拥有 inputBuffer 和 outputBuffer 两个缓冲区成员。而缓冲区的设计特点:

  1. 其内部使用std::vector<char>保存数据,并提供许多访问方法。并且std::vector拥有扩容空间的操作,可以适应数据的不断添加。
  2. std::vector<char>内部分为三块,头部预留空间,可读空间,可写空间。内部使用索引标注每个空间的起始位置。每次往里面写入数据,就移动writeIndex;从里面读取数据,就移动readIndex

Buffer基本成员

1663491010(1).png

class Buffer : public muduo::copyable
{
public:
    static const size_t kCheapPrepend = 8; // 头部预留8个字节
    static const size_t kInitialSize = 1024; // 缓冲区初始化大小 1KB

    explicit Buffer(size_t initialSize = kInitialSize)
        : buffer_(kCheapPrepend + initialSize), // buffer分配大小 8 + 1KB
            readerIndex_(kCheapPrepend), // 可读索引和可写索引最开始位置都在预留字节后
            writerIndex_(kCheapPrepend) 
    {
        assert(readableBytes() == 0);
        assert(writableBytes() == initialSize);
        assert(prependableBytes() == kCheapPrepend);
    }

	/*......*/

	// 可读空间大小
	size_t readableBytes() const
	{ return writerIndex_ - readerIndex_; }
	
	// 可写空间大小
	size_t writableBytes() const
	{ return buffer_.size() - writerIndex_; }
	
	// 预留空间大小
	size_t prependableBytes() const
	{ return readerIndex_; }
	
	// 返回可读空间地址
	const char* peek() const
	{ return begin() + readerIndex_; }

	/*......*/
	
private:
	std::vector<char> buffer_; // 缓冲区其实就是vector<char>
	size_t readerIndex_; // 可读区域开始索引
	size_t writerIndex_; // 可写区域开始索引
};

读写数据时对Buffer的操作

42056ba58ecff7fc0b921f751a77dbf.png

b28b5599095a2af065df34c25784786.png

4153384dbba933245c1ab9fff69d3ed.png

向Buffer写入数据:readFd

ssize_t Buffer::readFd(int fd, int* savedErrno):表示从 fd 中读取数据到 buffer_ 中。对于 buffer 来说这是写入数据的操作,会改变writeIndex

  1. 考虑到 buffer_ 的 writableBytes 空间大小,不能够一次性读完数据,于是内部还在栈上创建了一个临时缓冲区 char extrabuf[65536];。如果有多余的数据,就将其读入到临时缓冲区中。
  2. 因为可能要写入两个缓冲区,所以使用了更加高效readv函数,可以向多个地址写入数据。刚开始会判断需要写入的大小。
    1. 如果一个缓冲区足够,就不必再往临时缓冲区extrabuf写入数据了。写入后需要更新writeIndex位置,writerIndex_ += n;
    2. 如果一个缓冲区不够,则还需往临时缓冲区extrabuf写入数据。原缓冲区直接写满,writeIndex_ = buffer_.size()。然后往临时缓冲区写入数据,append(extrabuf, n - writable);
/**
 * inputBuffer::TcpConnection 从 socket 读取数据,然后写入 inputBuffer
 * 这个对于buffer_来说是将数据写入的操作,所以数据在writeIndex之后
 * 客户端从 inputBuffer 读取数据。
 */
ssize_t Buffer::readFd(int fd, int* savedErrno)
{
    // saved an ioctl()/FIONREAD call to tell how much to read
    char extrabuf[65536];
    struct iovec vec[2];
    const size_t writable = writableBytes();
    /**
     * 从fd读取数据到两个地方
     * 1.writeIndex
     * 2.stack上的临时数组变量(防止不能一次性读完fd上的数据)
     */
    vec[0].iov_base = begin()+writerIndex_;
    vec[0].iov_len = writable;
    vec[1].iov_base = extrabuf;
    vec[1].iov_len = sizeof extrabuf;
    // when there is enough space in this buffer, don't read into extrabuf.
    // when extrabuf is used, we read 128k-1 bytes at most.
    // 判断需要写入几个缓冲区
    const int iovcnt = (writable < sizeof extrabuf) ? 2 : 1;
    const ssize_t n = sockets::readv(fd, vec, iovcnt);
    if (n < 0)
    {
        *savedErrno = errno;
    }
    else if (implicit_cast<size_t>(n) <= writable)
    {
        // 如果从fd读取数据长度小于buffer可写数据空间,则直接更改writerIndex索引即可
        writerIndex_ += n;
    }
    else
    {
        // buffer可写数据空间不够,还需写入extrabuf
        // writerIndex直接到尾部
        writerIndex_ = buffer_.size();
        append(extrabuf, n - writable);
    }
    // if (n == writable + sizeof extrabuf)
    // {
    //   goto line_30;
    // }
    return n;
}

其中的 append 函数真正向 buffer_ 内部添加数据。调用方将数据的首地址和长度给出,其内部将数据拷贝到指定位置。

// 向buffer_添加数据
void append(const char* /*restrict*/ data, size_t len)
{
	// 确保可写空间足够
	ensureWritableBytes(len);
	// 将这段数据拷贝到可写位置之后
	std::copy(data, data+len, beginWrite());
	hasWritten(len);
}

空间不够怎么办?

如果写入空间不够,Buffer 内部会有两个方案来应付

  1. 将数据往前移动:因为每次读取数据,readIndex索引都会往后移动,从而导致前面预留的空间逐渐增大。我们需要将后面的元素重新移动到前面。
  2. 如果第一种方案的空间仍然不够,那么我们就直接对 buffer_ 进行扩容(buffer_.resize(len))操作。

如图所示:现在的写入空间不够,但是前面的预留空间加上现在的写空间是足够的。因此,我们需要将后面的数据拷贝到前面,腾出足够的写入空间。

652d05b2afe60d2c3939e1ea6fb64b6.png 797797d7067e41e1f3e1ff62c20b3a5.png

muduo 的代码实现:

// 保证写空间足够len,如果不够则扩容
void ensureWritableBytes(size_t len)
{
	if (writableBytes() < len)
	{
		makeSpace(len);
	}
	assert(writableBytes() >= len);
}

// 扩容空间
void makeSpace(size_t len)
{
	// prependIndex -------------readIndex---writeIndex-
	// 
	// 因为readIndex一直往后,之前的空间没有被利用,我们可以将后面数据复制到前面
	// 如果挪位置都不够用,则只能重新分配buffer_大小
	if (writableBytes() + prependableBytes() < len + kCheapPrepend)
	{
		// FIXME: move readable data
		buffer_.resize(writerIndex_+len);
	}
	else
	{
		// move readable data to the front, make space inside buffer
		assert(kCheapPrepend < readerIndex_);
		size_t readable = readableBytes();
		std::copy(begin()+readerIndex_,
				begin()+writerIndex_,
				begin()+kCheapPrepend);
		// 读取空间地址回归最开始状态
		readerIndex_ = kCheapPrepend;
		// 可以看到这一步,写空间位置前移了
		writerIndex_ = readerIndex_ + readable;
		assert(readable == readableBytes());
	}
}

从Buffer中读取数据

就如回声服务器的例子一样:

void EchoServer::onMessage(const muduo::net::TcpConnectionPtr& conn,
                           muduo::net::Buffer* buf,
                           muduo::Timestamp time)
{
	// 从 buf 中读取所有数据,返回 string 类型
    muduo::string msg(buf->retrieveAllAsString());
    LOG_INFO << conn->name() << " echo " << msg.size() << " bytes, "
            << "data received at " << time.toString();
    conn->send(msg);
}

读取数据会调用void retrieve(size_t len)函数,在这之前会判断读取长度是否大于可读取空间

  1. 如果小于,则直接后移readIndex即可,readerIndex_ += len;
  2. 如果大于等于,说明全部数据都读取出来。此时会将buffer置为初始状态:
    1. readerIndex_ = kCheapPrepend;
    2. writerIndex_ = kCheapPrepend;
// 将可读取的数据按照string类型全部取出
string retrieveAllAsString()
{
	return retrieveAsString(readableBytes());
}

// string(peek(), len)
string retrieveAsString(size_t len)
{
	assert(len <= readableBytes());
	string result(peek(), len);
	retrieve(len); // 重新置位
	return result;
}

// retrieve returns void, to prevent
// string str(retrieve(readableBytes()), readableBytes());
// the evaluation of two functions are unspecified
// 读取len长度数据
void retrieve(size_t len)
{
	assert(len <= readableBytes());
	if (len < readableBytes())
	{
		// 读取长度小于可读取空间,直接更新索引
		readerIndex_ += len;
	}
	// 读取长度大于等于可读取空间
	else
	{
		retrieveAll();
	}
}

// 读取所有数据
void retrieveAll()
{
	// 全部置为初始状态
	readerIndex_ = kCheapPrepend;
	writerIndex_ = kCheapPrepend;
}

TcpConnection使用Buffer

TcpConnection 拥有 inputBuffer 和 outputBuffer 两个缓冲区成员。

  1. 当服务端接收客户端数据,EventLoop 返回活跃的 Channel,并调用对应的读事件处理函数,即 TcpConnection 调用 handleRead 方法从相应的 fd 中读取数据到 inputBuffer 中。在 Buffer 内部 inputBuffer 中的 writeIndex 向后移动。
  2. 当服务端向客户端发送数据,TcpConnection 调用 handleWrite 方法将 outputBuffer 的数据写入到 TCP 发送缓冲区。outputBuffer 内部调用 retrieve 方法移动 readIndex 索引。

1663491937(1).png

TcpConnection接收客户端数据(从客户端sock读取数据到inputBuffer)

  1. 调用inputBuffer_.readFd(channel_->fd(), &savedErrno);将对端fd数据读取到inputBuffer中。
    1. 如果读取成功,调用「可读事件发生回调函数」
    2. 如果读取数据长度为0,说明对端关闭连接。调用handleCose()
    3. 出错,则保存errno,调用handleError()
/**
 * 消息读取,TcpConnection从客户端读取数据
 * 调用Buffer.readFd(fd, errno) -> 内部调用readv将数据从fd读取到缓冲区 -> inputBuffer
 */
void TcpConnection::handleRead(Timestamp receiveTime)
{
    loop_->assertInLoopThread();
    int savedErrno = 0;
    // 将 channel_->fd() 数据读取到 inputBuffer_ 中,出错信息保存到 savedErrno 中
    ssize_t n = inputBuffer_.readFd(channel_->fd(), &savedErrno);
    if (n > 0)
    {
        // 已建立连接的用户,有可读事件发生,调用用户传入的回调操作onMessage
        messageCallback_(shared_from_this(), &inputBuffer_, receiveTime);
    }
    // 读取不到数据,关闭此连接
    else if (n == 0)
    {
        handleClose();
    }
    // 出错
    else
    {
        errno = savedErrno;
        LOG_SYSERR << "TcpConnection::handleRead";
        handleError();
    }
}

TcpConnection向客户端发送数据(将ouputBuffer数据输出到socket中)

// 此行代码的用意何在
if (channel_->isWriting())
  1. 要在channel_确实关注写事件的前提下正常发送数据:因为一般有一个send函数发送数据,如果TCP接收缓冲区不够接收ouputBuffer的数据,就需要多次写入。需要重新注册写事件,因此是在注册了写事件的情况下调用的handleWrite
  2. channel->fd()发送outputBuffer中的可读取数据。成功发送数据则移动readIndex,并且如果一次性成功写完数据,就不再让此channel关注写事件了,并调用写事件完成回调函数没写完则继续关注!
void TcpConnection::handleWrite()
{
    loop_->assertInLoopThread();
    // channel关注了写事件
    if (channel_->isWriting())
    {
        // 向客户端fd写数据,[peek, peek + readable)
        ssize_t n = sockets::write(channel_->fd(),
                                    outputBuffer_.peek(),
                                    outputBuffer_.readableBytes());
        // 成功写入数据
        if (n > 0)
        {
            // 重置readIndex位置,向后移动n,表示这n个字节的数据都被读取出来了
            outputBuffer_.retrieve(n);
            // 缓冲区可读空间为0,说明 writeIndex - readIndex = 0
            // 我们一次性将数据写完了
            if (outputBuffer_.readableBytes() == 0)
            {
                // channel不再关注写事件
                channel_->disableWriting();
                if (writeCompleteCallback_)
                {
                    // 调用用户自定义的写完成事件函数
                    loop_->queueInLoop(std::bind(writeCompleteCallback_, shared_from_this()));
                }
                if (state_ == kDisconnecting)
                {
                    // TcpCOnnection关闭写端
                    shutdownInLoop();
                }
            }
        }
        else
        {
            LOG_SYSERR << "TcpConnection::handleWrite";
            // if (state_ == kDisconnecting)
            // {
            //   shutdownInLoop();
            // }
        }
    }
    else
    {
        LOG_TRACE << "Connection fd = " << channel_->fd()
                    << " is down, no more writing";
    }
}

参考

Muduo库中的Buffer设计_烊萌的博客-CSDN博客