当前位置:网站首页 > Java教程 > 正文

java nio 入门教程详解



在学习 NIO 之前,需要先了解一下计算机 I/O 模型的基础理论知识。还不了解的话,可以参考我写的这篇文章:Java IO 模型详解。

在传统的 Java I/O 模型(BIO)中,I/O 操作是以阻塞的方式进行的。也就是说,当一个线程执行一个 I/O 操作时,它会被阻塞直到操作完成。这种阻塞模型在处理多个并发连接时可能会导致性能瓶颈,因为需要为每个连接创建一个线程,而线程的创建和切换都是有开销的。

为了解决这个问题,在 Java1.4 版本引入了一种新的 I/O 模型 — NIO (New IO,也称为 Non-blocking IO) 。NIO 弥补了同步阻塞 I/O 的不足,它在标准 Java 代码中提供了非阻塞、面向缓冲、基于通道的 I/O,可以使用少量的线程来处理多个连接,大大提高了 I/O 效率和并发。

下图是 BIO、NIO 和 AIO 处理客户端请求的简单对比图(关于 AIO 的介绍,可以看我写的这篇文章:Java IO 模型详解,不是重点,了解即可)。

BIO、NIO 和 AIO 对比
BIO、NIO 和 AIO 对比

⚠️需要注意:使用 NIO 并不一定意味着高性能,它的性能优势主要体现在高并发和高延迟的网络环境下。当连接数较少、并发程度较低或者网络传输速度较快时,NIO 的性能并不一定优于传统的 BIO 。

NIO 主要包括以下三个核心组件:

  • Buffer(缓冲区):NIO 读写数据都是通过缓冲区进行操作的。读操作的时候将 Channel 中的数据填充到 Buffer 中,而写操作时将 Buffer 中的数据写入到 Channel 中。
  • Channel(通道):Channel 是一个双向的、可读可写的数据传输通道,NIO 通过 Channel 来实现数据的输入输出。通道是一个抽象的概念,它可以代表文件、套接字或者其他数据源之间的连接。
  • Selector(选择器):允许一个线程处理多个 Channel,基于事件驱动的 I/O 多路复用模型。所有的 Channel 都可以注册到 Selector 上,由 Selector 来分配线程来处理事件。

三者的关系如下图所示(暂时不理解没关系,后文会详细介绍):

Buffer、Channel和Selector三者之间的关系
Buffer、Channel和Selector三者之间的关系

下面详细介绍一下这三个组件。

在传统的 BIO 中,数据的读写是面向流的, 分为字节流和字符流。

在 Java 1.4 的 NIO 库中,所有数据都是用缓冲区处理的,这是新库和之前的 BIO 的一个重要区别,有点类似于 BIO 中的缓冲流。NIO 在读取数据时,它是直接读到缓冲区中的。在写入数据时,写入到缓冲区中。 使用 NIO 在读写数据时,都是通过缓冲区进行操作。

的子类如下图所示。其中,最常用的是 ,它可以用来存储和操作字节数据。

Buffer 的子类
Buffer 的子类

你可以将 Buffer 理解为一个数组,、、 等分别对应 、、 等。

为了更清晰地认识缓冲区,我们来简单看看 类中定义的四个成员变量:

这四个成员变量的具体含义如下:

  1. 容量():可以存储的最大数据量,创建时设置且不可改变;
  2. 界限(): 中可以读/写数据的边界。写模式下, 代表最多能写入的数据,一般等于 (可以通过方法设置);读模式下, 等于 Buffer 中实际写入的数据大小。
  3. 位置():下一个可以被读写的数据的位置(索引)。从写操作模式到读操作模式切换的时候(flip), 都会归零,这样就可以从头开始读写了。
  4. 标记():允许将位置直接定位到该标记处,这是一个可选属性;

并且,上述变量满足如下的关系:0 <= mark <= position <= limit <= capacity

另外,Buffer 有读模式和写模式这两种模式,分别用于从 Buffer 中读取数据或者向 Buffer 中写入数据。Buffer 被创建之后默认是写模式,调用 可以切换到读模式。如果要再次切换回写模式,可以调用 或者 方法。

position 、limit 和 capacity 之前的关系
position 、limit 和 capacity 之前的关系
position 、limit 和 capacity 之前的关系
position 、limit 和 capacity 之前的关系

对象不能通过 调用构造方法创建对象 ,只能通过静态方法实例化 。

这里以 为例进行介绍:

Buffer 最核心的两个方法:

  1. : 读取缓冲区的数据
  2. :向缓冲区写入数据

除上述两个方法之外,其他的重要方法:

  • :将缓冲区从写模式切换到读模式,它会将 的值设置为当前 的值,将 的值设置为 0。
  • : 清空缓冲区,将缓冲区从读模式切换到写模式,并将 的值设置为 0,将 的值设置为 的值。
  • ……

Buffer 中数据变化的过程:

输出:

为了帮助理解,我绘制了一张图片展示 、和每一阶段的变化。

capacity、limit和position每一阶段的变化
capacity、limit和position每一阶段的变化

Channel 是一个通道,它建立了与数据源(如文件、网络套接字等)之间的连接。我们可以利用它来读取和写入数据,就像打开了一条自来水管,让数据在 Channel 中自由流动。

BIO 中的流是单向的,分为各种 (输入流)和 (输出流),数据只是在一个方向上传输。通道与流的不同之处在于通道是双向的,它可以用于读、写或者同时用于读写。

Channel 与前面介绍的 Buffer 打交道,读操作的时候将 Channel 中的数据填充到 Buffer 中,而写操作时将 Buffer 中的数据写入到 Channel 中。

Channel 和 Buffer之间的关系
Channel 和 Buffer之间的关系

另外,因为 Channel 是全双工的,所以它可以比流更好地映射底层操作系统的 API。特别是在 UNIX 网络编程模型中,底层操作系统的通道都是全双工的,同时支持读写操作。

的子类如下图所示。

Channel 的子类
Channel 的子类

其中,最常用的是以下几种类型的通道:

  • :文件访问通道;
  • 、:TCP 通信通道;
  • :UDP 通信通道;
Channel继承关系图
Channel继承关系图

Channel 最核心的两个方法:

  1. :读取数据并写入到 Buffer 中。
  2. :将 Buffer 中的数据写入到 Channel 中。

这里我们以 为例演示一下是读取文件数据的。

Selector(选择器) 是 NIO 中的一个关键组件,它允许一个线程处理多个 Channel。Selector 是基于事件驱动的 I/O 多路复用模型,主要运作原理是:通过 Selector 注册通道的事件,Selector 会不断地轮询注册在其上的 Channel。当事件发生时,比如:某个 Channel 上面有新的 TCP 连接接入、读和写事件,这个 Channel 就处于就绪状态,会被 Selector 轮询出来。Selector 会将相关的 Channel 加入到就绪集合中。通过 SelectionKey 可以获取就绪 Channel 的集合,然后对这些就绪的 Channel 进行相应的 I/O 操作。

Selector 选择器工作示意图
Selector 选择器工作示意图

一个多路复用器 Selector 可以同时轮询多个 Channel,由于 JDK 使用了 代替传统的 实现,所以它并没有最大连接句柄 的限制。这也就意味着只需要一个线程负责 Selector 的轮询,就可以接入成千上万的客户端。

Selector 可以监听以下四种事件类型:

  1. :表示通道接受连接的事件,这通常用于 。
  2. :表示通道完成连接的事件,这通常用于 。
  3. :表示通道准备好进行读取的事件,即有数据可读。
  4. :表示通道准备好进行写入的事件,即可以写入数据。

是抽象类,可以通过调用此类的 静态方法来创建 Selector 实例。Selector 可以同时监控多个 的 状况,是非阻塞 的核心。

一个 Selector 实例有三个 集合:

  1. 所有的 集合:代表了注册在该 Selector 上的 ,这个集合可以通过 方法返回。
  2. 被选择的 集合:代表了所有可通过 方法获取的、需要进行 处理的 Channel,这个集合可以通过 返回。
  3. 被取消的 集合:代表了所有被取消注册关系的 ,在下一次执行 方法时,这些 对应的 会被彻底删除,程序通常无须直接访问该集合,也没有暴露访问的方法。

简单演示一下如何遍历被选择的 集合并进行处理:

Selector 还提供了一系列和 相关的方法:

  • :监控所有注册的 ,当它们中间有需要处理的 操作时,该方法返回,并将对应的 加入被选择的 集合中,该方法返回这些 的数量。
  • :可以设置超时时长的 操作。
  • :执行一个立即返回的 操作,相对于无参数的 方法而言,该方法不会阻塞线程。
  • :使一个还未返回的 方法立刻返回。
  • ……

使用 Selector 实现网络读写的简单示例:

在示例中,我们创建了一个简单的服务器,监听 8080 端口,使用 Selector 处理连接、读取和写入事件。当接收到客户端的数据时,服务器将读取数据并将其打印到控制台,然后向客户端回复 "Hello, Client!"。

零拷贝是提升 IO 操作性能的一个常用手段,像 ActiveMQ、Kafka 、RocketMQ、QMQ、Netty 等顶级开源项目都用到了零拷贝。

零拷贝是指计算机执行 IO 操作时,CPU 不需要将数据从一个存储区域复制到另一个存储区域,从而可以减少上下文切换以及 CPU 的拷贝时间。也就是说,零拷贝主要解决操作系统在处理 I/O 操作时频繁复制数据的问题。零拷贝的常见实现技术有: 、和 。

下图展示了各种零拷贝技术的对比图:

CPU 拷贝DMA 拷贝系统调用上下文切换传统方法22read+write4mmap+write12mmap+write4sendfile12sendfile2sendfile + DMA gather copy02sendfile2

可以看出,无论是传统的 I/O 方式,还是引入了零拷贝之后,2 次 DMA(Direct Memory Access) 拷贝是都少不了的。因为两次 DMA 都是依赖硬件完成的。零拷贝主要是减少了 CPU 拷贝及上下文的切换。

Java 对零拷贝的支持:

  • 是 NIO 基于内存映射()这种零拷⻉⽅式的提供的⼀种实现,底层实际是调用了 Linux 内核的 系统调用。它可以将一个文件或者文件的一部分映射到内存中,形成一个虚拟内存文件,这样就可以直接操作内存中的数据,而不需要通过系统调用来读写文件。
  • 的是 NIO 基于发送文件()这种零拷贝方式的提供的一种实现,底层实际是调用了 Linux 内核的 系统调用。它可以直接将文件数据从磁盘发送到网络,而不需要经过用户空间的缓冲区。关于的用法可以看看这篇文章:Java NIO 文件通道 FileChannel 用法。

代码示例:

这篇文章我们主要介绍了 NIO 的核心知识点,包括 NIO 的核心组件和零拷贝。

如果我们需要使用 NIO 构建网络程序的话,不建议直接使用原生 NIO,编程复杂且功能性太弱,推荐使用一些成熟的基于 NIO 的网络编程框架比如 Netty。Netty 在 NIO 的基础上进行了一些优化和扩展比如支持多种协议、支持 SSL/TLS 等等。

  • Java NIO 浅析:https://tech.meituan.com/2016/11/04/nio.html
  • 面试官:Java NIO 了解?https://mp.weixin..com/s/mZobf-U8OSYQfHfYBEB6KA
  • Java NIO:Buffer、Channel 和 Selector:https://www.javadoop.com/post/java-nio
JavaGuide 官方公众号
JavaGuide 官方公众号

版权声明


相关文章:

  • java ee eclipse教程2025-01-04 20:02:01
  • java安装教程全套2025-01-04 20:02:01
  • java模块制作教程2025-01-04 20:02:01
  • Java程序设计与开发教程2025-01-04 20:02:01
  • java教程边框2025-01-04 20:02:01
  • java 教程入门推荐2025-01-04 20:02:01
  • 魂斗罗java编码教程2025-01-04 20:02:01
  • java linux 编程视频教程2025-01-04 20:02:01
  • 芜湖java教程咨询2025-01-04 20:02:01
  • java play教程2025-01-04 20:02:01