(一) BIO,NIO, 阻塞,非阻塞,你懂了吗
阅读原文时间:2023年07月08日阅读:1

一般来说,一个输入操作通常包括两个阶段:

、等待数据准备好;
、从内核向进程复制数据

是否同步的判断依据是: 是否 针对的 整个过程,即2个阶段,是否有阻塞

是否阻塞的判断依据是: 按 程序等待消息通知时的状态角度来说的,,即针对第一阶段来说

例子很形象:

https://my.oschina.net/u/1859679/blog/1839169

Linux 认为

1、用系统调用 read 从 socket 里读取 一段数据
2、用系统调用read 从 一个磁盘文件读取一段数据到 内核

分 网路IO 和 磁盘文件 IO。 网络IO 才做 BLOCK。

一个解释是,所谓“Block”是指操作系统可以预见这个Block会发生才会主动Block。
例如当读取TCP连接的数据时,如果发现Socket buffer里没有数据就可以确定定对方还没有发过来,于是Block;
而对于普通磁盘文件的读写,也许磁盘运作期间会抖动,会短暂暂停,但是操作系统无法预见这种情况,只能视作不会Block,照样执行。

1、Unix 5中 IO模型

  • 阻塞式I/O;
  • 非阻塞式I/O;
  • I/O复用(select,poll,epoll…);
  • 信号驱动式I/O(SIGIO);
  • 异步I/O(POSIX的aio_系列函数);

同步阻塞IO模型是最常用的一个模型。 linux中 默认情况下所有的socket都是 blocing,

在这个模型中,用户空间的应用程序执行一个系统调用 recvform, 这会导致应用程序阻塞,睡没也不干,直到数据准备好,等待 kenel准备好 从 网络上姐都到的 数据包 + 等待收到的报文 被 从 kernel 赋值到bug中,recvform 方法才会返回,最后 进程在处理数据。

 

非阻塞IO, 对一个非阻塞描述符 循环调用 recvfrom,持续的轮询(polling),以查看某个操作是否就绪。与阻塞IO不一样,非阻塞将大的 整片时间的阻塞 分成 N多的小的阻塞, 所有 进程 不断的有机会 被 CPU 光顾。

非阻塞的 recvfrom 系统调用后,进程并没有被阻塞,内核马上返回给进程,如果数据没有准备好,会返回 error。 进程在返回之后,可以干其他事情,然后在发起recvfrom 系统调用。如此循环的仅从 recvfrom 系统调用,检查内核数据,直到数据准备好,在拷贝数据到进程。拷贝数据整个过程,进程仍然是属于 阻塞的状态。

IO multiplexing 就是我们说的 select,poll,epoll。(多路复用,因为它 可以同时监听多个 fd, 减少了为每个需要监听的fd 开启线程的开销)

select 调用是内核级别的,可以等待多个socket,能实现同时多多个 IO端口进行监听, 当其中任何一个socket 的数据准备好了,就能返回进行 可读(写),然后进程在进行 recvform 系统调用,将数据由 内核 拷贝到用户进程,这个过程是阻塞的。

IO复用模型会用到 select,poll,epoll函数,这几个函数也会使进程阻塞,但是和阻塞IO所不同的, 这几个函数可以同时阻塞多个 IO操作,多个写操作的 IP函数 进行检测,直到有数据 可读或可写 时(不是等到socket数据全部到达再处理, 而是有了一部分数据就会调用用户进程来处理),才进行真正地调用 IO操作函数。

IO复用有人把其成为同步非阻塞的,也有称为同步阻塞。其实这个是否阻塞还需要看第一个阶段,第一个阶段有的阻塞,有的不阻塞。主要也是阻塞在select阶段,属于用户主动等待阶段,我们且规范为阻塞状态,所以,把IO多路复用归为同步阻塞模式。

 

信号驱动式I/O:首先我们允许Socket进行信号驱动IO,并安装一个信号处理函数,进程继续运行并不阻塞。当数据准备好时,进程会收到一个SIGIO信号,可以在信号处理函数中调用I/O操作函数处理数据。

也就是说第一个阶段,完全是非阻塞的,等数据到达会给一个信号通知,第二个阶段recvfrom还是阻塞过程,和之上无差异。

 

异步IO不是顺序执行,用户进程进行aio_read系统调用之后,无论内核数据是否准备好,都会直接返回给用户进程,然后用户态进程可以去做别的事情。等到socket数据准备好了,内核直接复制数据给进程,然后从内核向进程发送通知。IO两个阶段,进程都是非阻塞的。

 

2、JAVA IO

Unix中的五种I/O模型,除信号驱动I/O外,Java对其它四种I/O模型都有所支持。其中Java最早提供的

blocking I/O即是同步阻塞I/O,

而NIO即是同步非阻塞I/O,

同时通过NIO实现的Reactor模式即是I/O复用模型的实现,

通过AIO实现的Proactor模式即是异步I/O模型的实现。