Java中的stream流的概念解析及实际运用总结
作者:pizzq
流是字节序列的抽象概念。
文件是数据的静态存储形式,而流是指数据传输时的形态。
流类分为两个大类:节点流类和过滤流类(也叫处理流类)。
程序用于直接操作目标设备所对应的类叫节点流类,程序也可以通过一个间接流类去调用节点流类,以达到更加灵活方便地读取各种类型的数据,这个间接流类就是过滤流类(也叫处理流类),或者称为包装类。
包装类的调用过程如下图:
流分类的关系
不管流的分类是多么的丰富和复杂,其根源来自于四个基本的类。这个四个类的关系如下:
字节流 | 字符流 | |
输入流 | InputStream | Reader |
输出流 | OutputStream | Writer |
Java内用 Unicode 编码存储字符,字符流处理类负责将外部的其他编码的字符流和java内 Unicode 字符流之间的转换。而类InputStreamReader 和OutputStreamWriter处理字符流和字节流的转换。字符流(一次可以处理一个缓冲区)一次操作比字节流(一次一个字节)效率高。
InputStream
由于InputStream和OutputStream是abstact类,所以它们还不能表明具体对应哪种IO设备。它们下面有许多子类,包括网络、管道、内存、文件等具体的IO设备,实际程序中使用的它们的各种子类对象。
注:我们将节点流类所对应的IO源和目标称为流节点(Node)。
注意:将A文件的内容写入B文件,程序对A文件的操作所用的是输出类还是输入类这个问题。输入输出类是相对程序而言的,而不是代表文件的,所以我们应该创建一个输入类来完成对A文件的操作,创建一个输出类来完成对B文件的操作。
OutputStream
以字符为导向的 stream Reader/Writer
以 Unicode 字符为导向的 stream ,表示以 Unicode 字符为单位从 stream 中读取或往 stream 中写入信息。同样,Reader/Writer也为abstact类。
Reader
Writer
IO程序代码的复用:
平时写代码用-1来作为键盘输入的结束,在写的函数中不直接使用System.in,只是在调用该函数时,将System.in作为参数传递进去,这样,我们以后要从某个文件中读取数据,来代替手工键盘输入时,我们可以直接使用这个函数,程序就不用做太多的修改了,达到以不变应万变的效果。
字节流和字符流的相互转换
InputStreamReader和OutputStreamReader:把一个以字节为导向的stream转换成一个以字符为导向的stream。
InputStreamReader类是从字节流到字符流的桥梁:它读入字节,并根据指定的编码方式,将之转换为字符流。
使用的编码方式可能由名称指定,或平台可接受的缺省编码方式。
InputStreamReader的read()方法之一的每次调用,可能促使从基本字节输入流中读取一个或多个字节。
为了达到更高效率,考虑用BufferedReader封装InputStreamReader,
BufferedReader in = new BufferedReader(new InputStreamReader(System.in));
Java流使用的一点总结
最经工作中碰到不少Java流的使用,总结如下:
1. 生成Zip格式,遇到的是要在一个Servlet中生成Zip文件,输出到web 客户端,直接下载。
response.setContentType("application/zip"); response.addHeader("Content-Disposition", "attachment;filename=/"xxx.zip/""); ZipOutputStream out = new ZipOutputStream(response.getOutputStream()) for() { ZipEntry entry = new ZipEntry("aa" + i ".dat"); out.putNewEntry(entry); bytes[] bt = s.getBytes(); out.writeBytes(bt, 0, bt.length()); out.closeEntry(); } out.flush(); out.close();
ZipOutputStream 继承自 java.io.FilterOutputStream. 因此真正的写操作是通过参数OutputStream out去写的。
其 void write(byte[] b, int off, int len) 最终调用了 out.write(b, off, len);
如果要生成一个zip文件,构造时就这样写 new ZipOutputStream(new FileOutputStream(path));
2. 类似的写XML.
XMLWriter writer = new XMLWriter(new FileOutputStream(path), formater)
writer.write(doc).道理和上面类似
3. 写文本文件,追加。
PrintStream ps = new PrintStream(new FileOutputStream(path, true), "utf-8") ps.println(s); // 能写boolean、int等各种类型。
其内部使用一个OutputStreamWriter的对象textOut来写。例如write(String s)最终调用到textOut.write(s);
这里涉及到编码的问题。其参数里的"utf-8"最终传递到OutputStream。
OutputStream是一个字符流和字节流之间的桥梁。
因此其提供了write(char[] cbuf, int off, int len) 和 write(String str, int off, int len) 用来写字符和字符串。
OutputStream内部又通过一个StreamEncoder对象来序列化字符和字符串。
4. 写出到socket。
DataOutputStream out = new DataOutputStream(socket.getOutputStream()); out.writeBytes(bt); out.writeBoolean(boolean v) ;
DataOutputStream同样是一个自FilterOutputStream.
5. 从文本中读取
BufferedReader reader = new BufferedReader(new FileReader(path)); reader.readLine();
BufferedReader的模式和上面的Filter模式一样,其内部存储一个Reader对象为参数传进来并用来实际读取的对象。
BufferedReader对应java 1.0的类就是BufferedInputStream,是一个FilterInputStream。
6. 从Socket中读取
BufferedInputStream is = new BufferedInputStream(socket.getInputStream()); is.read(bt, 0, bt.length());
总结:
基类Stream系列是InputStream和OutputStream,他们是抽象类,要求的方法只有(以Output为例)
void write(int b) throws IOException; void write(byte b[]) throws IOException void write(byte b[], int off, int len)
其最基本的只是字节操作。第1个方法看似写一个整数,其实只写一个字节(最低八个bit)。其子类分两个系列,一个是直接操作输出设备的,我们上面碰到的有文件(FileOutputStream)和Servlet输出(ServletOutputStream)。其他常用的还有一个 ByteArrayOutputStream,是直接在内存里操作的。
再就是FilterOutputStream系列了,都是接收一个OutputStream对象座位参数,真正的写操作通过该对象去完成。例如ZipOutputStream,其本身只负责生成压缩格式的数据,至于这些数据是写到文件、内存、还是servletResponse,由输入的参数确定。这就是装饰器模式。
Filter系列常用的有PrintStream(提供了print,println,write(boolean[int, char, string])各种操作,最终利用out.write方法以写字节的方式写进去。
还有DataOutputStream,其提供了writeByte/writeBoolean/writeDouble/writeLong/wiretUTF等方法。
还有就是socket/zip等不常用的。
Java的流很方便也很复杂。复杂就复杂在实现一个功能往往需要多个类,而且有多种组合的办法。尚需继续在实践中总结。