【死磕 NIO】— 深入分析Buffer
阅读原文时间:2021年11月17日阅读:1

大家好,我是大明哥,今天我们来看看 Buffer。

上面几篇文章详细介绍了 IO 相关的一些基本概念,如阻塞、非阻塞、同步、异步的区别,Reactor 模式、Proactor 模式。以下是这几篇文章的链接,有兴趣的同学可以阅读下:

从这篇文章开始,我们将回归 NIO 方面的相关知识,首先从 NIO 的三大核心组件说起。

  • Buffer

  • Channel

  • Selector

首先是 Buffer

Buffer 是一个抽象类,主要用作缓冲区,其实质我们可以认为是一个可以写入数据,然后从中读取数据的内存块。这块内存被包装成 NIO Buffer 对象,并提供一系列的方法便于我们访问这块内存。

要理解 Buffer 的工作原理,首先就要理解它的 4 个索引:

  • capacity:容量

  • position:位置

  • limit:界限

  • mark:标记

capacity 则表示该 Buffer 的容量,而 position 和 limit 的含义取决于 Buffer 处于什么模式(读模式或者写模式),下图描述读写模式下这三种属性的含义

  • capacity

capacity 表示容量,Buffer 是一个内存块,其存储数据的最大大小就是 capacity。我们不断地往 Buffer 中写入数据,当 Buffer 被写满后也就是存储的数据达到 capacity 了就需要将其清空,才能继续写入数据。

  • position

position 的含义取决于 Buffer 处于写模式还是读模式:

  • 如果是写模式,则写入的地方就是所谓的 position,其初始值是 0,最大值是 capacity - 1,当往 Buffer 中写入一个数据时,position 就会向前移动到下一个待写入的位置。

  • 如果是读模式,则读取数据的地方就是 position。当执行 flip() 将 buffer 从写模式切换到读模式时,position 会被重置为 0,随着数据不断的读取,position 不断地向前移,直到 limit。

  • limit

与 position 一样,limit 的含义也取决于 Buffer 处于何种模式:

  • 写模式:当 Buffer 处于写模式时,limit 是指能够往 Buffer 中写入多少数据,其值等于 capacity

  • 读模式:当 Buffer 处于读模式时,limit 表示能够从 Buffer 中最多能够读取多少数据出来,所以当 Buffer 从写模式切换到读模式时,limit 会被设置写模式下的 position 的值

  • mark

mark 仅仅只是一个标识,可以通过 mark() 方法进行设置,设置值为当前的 position

Buffer 提供了一系列的方法用来操作它,比如 clear() 用来清空缓冲区,filp() 用来读切换等等方法,下面将依次演示 Buffer 的主要方法,包含从 Buffer 获取实例、写入数据、读取数据、重置等等一个系列的操作流程,同时将 position、limit 两个参数打印出来,便于我们更好地理解 Buffer。

allocate()

要获取一个 Buffer 对象,首先就要为期分配内存空间,使用 allocate() 方法分配内存空间,如下:

DoubleBuffer buffer = DoubleBuffer.allocate(10);

System.out.println("================= allocate 10 后 =================");
System.out.println("capacity = " + buffer.capacity());
System.out.println("position = " + buffer.position());
System.out.println("limit = " + buffer.limit());

这里分配了 10 * sikeof(double) 字节的内存空间。需要注意的是 allocate() 里面参数并不是字节数,而是写入对象的数量,比如上面实例参数是 10 ,表明我们可以写 10 个 double 对象。

结果如下:

================= allocate 10 后 =================
capacity = 10
position = 0
limit = 10

此时,Buffer 的情况如下:

put()

调用 allocate() 分配内存后,得到 DoubleBuffer 实例对象,该对象目前处于写模式,我们可以通过 put() 方法向 Buffer 里面写入数据。

buffer.put(1);
buffer.put(2);

System.out.println("================= put 1、2 后 =================");
System.out.println("capacity = " + buffer.capacity());
System.out.println("position = " + buffer.position());
System.out.println("limit = " + buffer.limit());

调用 put() 往 DoubleBuffer 里面存放 2 个元素,此时,各自参数值如下:

================= put 1、2 后 =================
capacity = 10
position = 2
limit = 10

我们看到 position 的值变成了 2 ,指向第三个可以写入元素的位置。这个时候我们再写入 3 个元素:

buffer.put(3);
buffer.put(4);
buffer.put(5);

System.out.println("================= put 3、4、5 后 =================");
System.out.println("capacity = " + buffer.capacity());
System.out.println("position = " + buffer.position());
System.out.println("limit = " + buffer.limit());

得到结果如下:

================= put 3、4、5 后 =================
capacity = 10
position = 5
limit = 10

此时,position 的值变成 5 ,指向第 6 个可以写入元素的位置。

该 Buffer 的情况如下:

flip()

调用 put() 方法向 Buffer 中存储数据后,这时 Buffer 仍然处于写模式状态,在写模式状态下我们是不能直接从 Buffer 中读取数据的,需要调用 flip() 方法将 Buffer 从写模式切换为读模式。

buffer.flip();
System.out.println("================= flip 后 =================");
System.out.println("capacity = " + buffer.capacity());
System.out.println("position = " + buffer.position());
System.out.println("limit = " + buffer.limit());

得到的结果如下:

================= flip 后 =================
capacity = 10
position = 0
limit = 5

调用 flip() 方法将 Buffer 从写模式切换为读模式后,Buffer 的参数发生了微秒的变化:position = 0,limit = 5。前面说过在读模式下,limit 代表是 Buffer 的可读长度,它等于写模式下的 position,而 position 则是读的位置。

flip() 方法主要是将 Buffer 从写模式切换为读模式,其调整的规则如下:

  • 设置可读的长度 limit。将写模式写的 Buffer 中内容的最后位置 position 值变成读模式下的 limit 位置值,新的 limit 值作为读越界位置

  • 设置读的起始位置。将 position 的值设置为 0 ,表示从 0 位置处开始读

  • 如果之前有 mark 保存的标记位置,也需要消除,因为那是写模式下的 mark 标记

调动 flip() 后,该 Buffer 情况如下:

get()

调用 flip() 将 Buffer 切换为读模式后,就可以调用 get() 方法读取 Buffer 中的数据了,get() 读取数据很简单,每次从 position 的位置读取一个数据,并且将 position 向前移动 1 位。如下:

System.out.println("读取第 1 个位置的数据:" + buffer.get());
System.out.println("读取第 2 个位置的数据:" + buffer.get());
System.out.println("================= get 2 后 =================");
System.out.println("capacity = " + buffer.capacity());
System.out.println("position = " + buffer.position());
System.out.println("limit = " + buffer.limit());

连续调用 2 次 get() 方法,输出结果:

读取第 1 个位置的数据:1.0
读取第 2 个位置的数据:2.0
================= get 2 后 =================
capacity = 10
position = 2
limit = 5

position 的值变成了 2 ,表明它向前移动了 2 位,此时,Buffer 如下:

我们知道 limit 表明当前 Buffer 最大可读位置,buffer 也是一边读,position 位置一边往前移动,那如果越界读取呢?

System.out.println("读取第 3 个位置的数据:" + buffer.get());
System.out.println("读取第 4 个位置的数据:" + buffer.get());
System.out.println("读取第 5 个位置的数据:" + buffer.get());
System.out.println("读取第 6 个位置的数据:" + buffer.get());
System.out.println("读取第 7 个位置的数据:" + buffer.get());

limit = 5,6 、7 位置明显越界了,如果越界读取,Buffer 会抛出 BufferUnderflowException,如下:

读取第 3 个位置的数据:3.0
读取第 4 个位置的数据:4.0
读取第 5 个位置的数据:5.0
Exception in thread "main" java.nio.BufferUnderflowException
  at java.nio.Buffer.nextGetIndex(Buffer.java:500)
  at java.nio.HeapDoubleBuffer.get(HeapDoubleBuffer.java:135)
  at com.chenssy.study.nio.BufferTest.main(BufferTest.java:48)

rewind()

position 是随着读取的进度一直往前移动的,那如果我想在读取一遍数据呢?使用 rewind() 方法,可以进行重复读。rewind() 也叫做倒带,就想播放磁带一样,倒回去重新读。

buffer.rewind();
System.out.println("================= rewind 后 =================");
System.out.println("capacity = " + buffer.capacity());
System.out.println("position = " + buffer.position());
System.out.println("limit = " + buffer.limit());

运行结果:

================= rewind 后 =================
capacity = 10
position = 0
limit = 5

可以看到,仅仅只是将 position 的值设置为了 0,limit 的值保持不变。

clear() 和 compact()

flip() 方法用于将 Buffer 从写模式切换到读模式,那怎么将 Buffer 从读模式切换至写模式呢?可以调用 clear()compact() 两个方法。

  • clear()

    buffer.clear();

    System.out.println("================= clear 后 =================");
    System.out.println("capacity = " + buffer.capacity());
    System.out.println("position = " + buffer.position());
    System.out.println("limit = " + buffer.limit());

运行结果如下:

================= clear 后 =================
capacity = 10
position = 0
limit = 10

调用 clear() 后,我们发现 position 的值变成了 0,limit 值变成了 10,也就是 Buffer 被清空了,回归到最初始状态。但是里面的数据仍然是存在的,只是没有标记哪些数据是已读,哪些为未读。

  • compact()

compact() 方法也可以将 Buffer 从读模式切换到写模式,它跟 clear() 有一些区别。

buffer.compact();

System.out.println("================= compact 后 =================");
System.out.println("capacity = " + buffer.capacity());
System.out.println("position = " + buffer.position());
System.out.println("limit = " + buffer.limit());

运行结果如下:

================= compact 后 =================
capacity = 10
position = 3
limit = 10

可以看到 position 的值为 3,它与 clear() 区别就在于,它会将所有未读的数据全部复制到 Buffer 的前面(5次put(),两次 get()),将 position 设置到这些数据后面,所以此时是从未读的数据后面开始写入新的数据,Buffer 情况如下:

mark() 和 reset()

调用 mark() 方法可以标志一个指定的位置(即设置 mark 的值),之后调用 reset() 时,position 又会回到之前标记的位置。

通过上面的步骤演示,我想小伙伴基本上已经掌握了 Buffer 的使用方法,这里简要总结下,使用 Buffer 的步骤如下:

  1. 将数据写入 Buffer 中

  2. 调用 flip() 方法,将 Buffer 切换为读模式

  3. 从 Buffer 中读取数据

  4. 调用 clear() 或者 compact() 方法将 Buffer 切换为写模式

在 NIO 中主要有 8 中 Buffer,分别如下:

  • ByteBuffer

  • CharBuffer

  • DoubleBuffer

  • FloatBuffer

  • IntBuffer

  • LongBuffer

  • ShortBuffer

  • MappedByteBuffer

其 UML 类图如下:

这些不同的 Buffer 类型代表了不同的数据类型,使得可以通过 Buffer 直接操作如 char、short 等类型的数据而不是字节数据。这些 Buffer 基本上覆盖了所有能从 IO 中传输的 Java 基本数据类型,其中 MappedByteBuffer 是专门用于内存映射的的一种 ByteBuffer,后续会专门介绍。

到这里 Buffer 也就介绍完毕了,下篇文章将介绍它的协作者 Channel。