Skip to content

Latest commit

 

History

History
120 lines (75 loc) · 10.1 KB

Appendix-IO-Streams.md

File metadata and controls

120 lines (75 loc) · 10.1 KB

[TOC]

附录:流式IO

Java 7 引入了一种简单明了的方式来读写文件和操作目录。大多情况下,文件这一章所介绍的那些库和技术就足够你用了。但是,如果你必须面对一些特殊的需求和比较底层的操作,或者处理一些老版本的代码,那么你就必须了解本附录中的内容。

对于编程语言的设计者来说,实现良好的输入/输出(I/O)系统是一项比较艰难的任务,不同实现方案的数量就可以证明这点。其中的挑战似乎在于要涵盖所有的可能性,你不仅要覆盖到不同的 I/O 源和 I/O 接收器(如文件、控制台、网络连接等),还要实现多种与它们进行通信的方式(如顺序、随机访问、缓冲、二进制、字符、按行和按字等)。

Java 类库的设计者通过创建大量的类来解决这一难题。一开始,你可能会对 Java I/O 系统提供了如此多的类而感到不知所措。Java 1.0 之后,Java 的 I/O 类库发生了明显的改变,在原来面向字节的类中添加了面向字符和基于 Unicode 的类。在 Java 1.4 中,为了改进性能和功能,又添加了 nio 类(全称是 “new I/O”,Java 1.4 引入,到现在已经很多年了)。这部分在附录:新 I/O 中介绍。

因此,要想充分理解 Java I/O 系统以便正确运用它,我们需要学习一定数量的类。另外,理解 I/O 类库的演化过程也很有必要,因为如果缺乏历史的眼光,很快我们就会对什么时候该使用哪些类,以及什么时候不该使用它们而感到困惑。

编程语言的 I/O 类库经常使用这个抽象概念,它将所有数据源或者数据接收器表示为能够产生或者接收数据片的对象。

注意:Java 8 函数式编程中的 Stream 类和这里的 I/O stream 没有任何关系。这又是另一个例子,如果再给设计者一次重来的机会,他们将使用不同的术语。

I/O 流屏蔽了实际的 I/O 设备中处理数据的细节:

  1. 字节流对应原生的二进制数据;
  2. 字符流对应字符数据,它会自动处理与本地字符集之间的转换;
  3. 缓冲流可以提高性能,通过减少底层 API 的调用次数来优化 I/O。

从 JDK 文档的类层次结构中可以看到,Java 类库中的 I/O 类分成了输入和输出两部分。在设计 Java 1.0 时,类库的设计者们就决定让所有与输入有关系的类都继承自 InputStream,所有与输出有关系的类都继承自 OutputStream。所有从 InputStreamReader 派生而来的类都含有名为 read() 的基本方法,用于读取单个字节或者字节数组。同样,所有从 OutputStreamWriter 派生而来的类都含有名为 write() 的基本方法,用于写单个字节或者字节数组。但是,我们通常不会用到这些方法,它们之所以存在是因为别的类可以使用它们,以便提供更有用的接口。

我们很少使用单一的类来创建流对象,而是通过叠合多个对象来提供所期望的功能(这是装饰器设计模式)。为了创建一个流,你却要创建多个对象,这也是 Java I/O 类库让人困惑的主要原因。

这里我只会提供这些类的概述,并假定你会使用 JDK 文档来获取它们的详细信息(比如某个类的所以方法的详细列表)。

输入流类型

InputStream 表示那些从不同数据源产生输入的类,如表 I/O-1 所示,这些数据源包括:

  1. 字节数组;
  2. String 对象;
  3. 文件;
  4. “管道”,工作方式与实际生活中的管道类似:从一端输入,从另一端输出;
  5. 一个由其它种类的流组成的序列,然后我们可以把它们汇聚成一个流;
  6. 其它数据源,如 Internet 连接。

每种数据源都有相应的 InputStream 子类。另外,FilterInputStream 也属于一种 InputStream,它的作用是为“装饰器”类提供基类。其中,“装饰器”类可以把属性或有用的接口与输入流连接在一起,这个我们稍后再讨论。

表 I/O-1 InputStream 类型

功能 构造器参数 如何使用
ByteArrayInputStream 允许将内存的缓冲区当做 InputStream 使用 缓冲区,字节将从中取出 作为一种数据源:将其与 FilterInputStream 对象相连以提供有用接口
StringBufferInputStream String 转换成 InputStream 字符串。底层实现实际使用 StringBuffer 作为一种数据源:将其与 FilterInputStream 对象相连以提供有用接口
FileInputStream 用于从文件中读取信息 字符串,表示文件名、文件或 FileDescriptor 对象 作为一种数据源:将其与 FilterInputStream 对象相连以提供有用接口
PipedInputStream 产生用于写入相关 PipedOutputStream 的数据。实现“管道化”概念 PipedOutputSteam 作为多线程中的数据源:将其与 FilterInputStream 对象相连以提供有用接口
SequenceInputStream 将两个或多个 InputStream 对象转换成一个 InputStream 两个 InputStream 对象或一个容纳 InputStream 对象的容器 Enumeration 作为一种数据源:将其与 FilterInputStream 对象相连以提供有用接口
FilterInputStream 抽象类,作为“装饰器”的接口。其中,“装饰器”为其它的 InputStream 类提供有用的功能。见表 I/O-3 表 I/O-3 表 I/O-3

输出流类型

表 I/O-2 所示,该类别的类决定了输出所要去往的目标:字节数组(但不是 String,当然,你也可以用字节数组自己创建)、文件或管道。

另外,FilterOutputStream 为“装饰器”类提供了一个基类,“装饰器”类把属性或者有用的接口与输出流连接了起来,这些稍后会讨论。

表 I/O-2:OutputStream 类型

功能 构造器参数 如何使用
ByteArrayOutputStream 在内存中创建缓冲区。所有送往“流”的数据都要放置在此缓冲区 缓冲区初始大小(可选) 用于指定数据的目的地:将其与 FilterOutputStream 对象相连以提供有用接口
FileOutputStream 用于将信息写入文件 字符串,表示文件名、文件或 FileDescriptor 对象 用于指定数据的目的地:将其与 FilterOutputStream 对象相连以提供有用接口
PipedOutputStream 任何写入其中的信息都会自动作为相关 PipedInputStream 的输出。实现“管道化”概念 PipedInputStream 指定用于多线程的数据的目的地:将其与 FilterOutputStream 对象相连以提供有用接口
FilterOutputStream 抽象类,作为“装饰器”的接口。其中,“装饰器”为其它 OutputStream 提供有用功能。见表 I/O-4 表 I/O-4 表 I/O-4

添加属性和有用的接口

通过 FilterInputStreamInputStream 读取

表 I/O-3:FilterInputStream 类型

功能 构造器参数 如何使用
DataInputStream DataOutputStream 搭配使用,按照移植方式从流读取基本数据类型(intcharlong 等) InputStream 包含用于读取基本类型数据的全部接口
BufferedInputStream 使用它可以防止每次读取时都得进行实际写操作。代表“使用缓冲区” InputStream,可以指定缓冲区大小(可选) 本质上不提供接口,只是向进程添加缓冲功能。与接口对象搭配
LineNumberInputStream 跟踪输入流中的行号,可调用 getLineNumber()setLineNumber(int) InputStream 仅增加了行号,因此可能要与接口对象搭配使用
PushbackInputStream 具有能弹出一个字节的缓冲区,因此可以将读到的最后一个字符回退 InputStream 通常作为编译器的扫描器,我们可能永远也不会用到

通过 FilterOutputStreamOutputStream 写入

表 I/O-4:FilterOutputStream 类型

功能 构造器参数 如何使用
DataOutputStream DataInputStream 搭配使用,因此可以按照移植方式向流中写入基本类型数据(intcharlong 等) OutputStream 包含用于写入基本类型数据的全部接口
PrintStream 用于产生格式化输出。其中 DataOutputStream 处理数据的存储,PrintStream 处理显示 OutputStream,可以用 boolean 值指示是否每次换行时清空缓冲区(可选) 应该是对 OutputStream 对象的 final 封装。可能会经常用到它
BufferedOutputStream 使用它以避免每次发送数据时都进行实际的写操作。代表“使用缓冲区”。可以调用 flush() 清空缓冲区 OutputStream,可以指定缓冲区大小(可选) 本质上并不提供接口,只是向进程添加缓冲功能。与接口对象搭配

Reader和Writer

RandomAccessFile类

IO流典型用途

本章小结