java中的FileInputStream(输入流)
作者:李昕羽
一、File流概念
JAVA中针对文件的读写操作设置了一系列的流,其中主要有FileInputStream,FileOutputStream,FileReader,FileWriter四种最为常用的流
二、FileInputStream
1. FileInputStream概念
FileInputStream流被称为文件字节输入流,意思指对文件数据以字节的形式进行读取操作如读取图片视频等
2. 构造方法
2.1 通过打开与File类对象代表的实际文件的链接来创建FileInputStream流对象
public FileInputStream(File file) throws FileNotFoundException{}
若File类对象的所代表的文件不存在;不是文件是目录;或者其他原因不能打开的话,则会抛出FileNotFoundException
/** * * 运行会产生异常并被扑捉--因为不存在xxxxxxxx这样的文件 */ public static void main(String[] args) { File file=new File("xxxxxxxx"); //根据路径创建File类对象--这里路径即使错误也不会报错,因为只是产生File对象,还并未与计算机文件读写有关联 try { FileInputStream fileInputStream=new FileInputStream(file);//与根据File类对象的所代表的实际文件建立链接创建fileInputStream对象 } catch (FileNotFoundException e) { System.out.println("文件不存在或者文件不可读或者文件是目录"); } }
2.2 通过指定的字符串参数(路径)来创建File类对象,而后再与File对象所代表的实际路径建立链接创建FileInputStream流对象
public FileInputStream(String name) throws FileNotFoundException { this(name != null ? new File(name) : null); }
该方法实际调用的还是上面那个方法。
3. 相关方法
3.1 public int read() throws IOException
官方文档
public int read() throws IOException
从此输入流中读取一个数据字节。如果没有输入可用,则此方法将阻塞。
指定者:
类 InputStream 中的 read
返回:
下一个数据字节;如果已到达文件末尾,则返回 -1。
理解读取的字节为什么返回int型变量
- 从输入流中读取一个字节返回int型变量,若到达文件末尾,则返回-1
- 我们读取的字节实际是由8位二进制组成,二进制文件不利于直观查看,可以转成常用的十进制进行展示,因此需要把读取的字节从二进制转成十进制整数,故返回int型。
- 如果当文件未到底时,我们读取的是字节,若返回byte类型,那么势必造成同一方法返回类型不同的情况这是不允许的
- 既然说可以测试任意形式的文件,那么用两种不同格式的,测试文件data1.txt和data2.txt,里面均放入1个数字"1",两文件的格式分别为:ANSI和Unicode。
我们用如下代码测试
import java.io.FileInputStream; import java.io.IOException; public class Test { public static void main(String[] args) throws IOException { FileInputStream fis = new FileInputStream("data1.txt");//ANSI格式 for (int i = 0; i < 5; i++) { System.out.println(fis.read()); } fis.close(); System.out.println("------------------"); fis = new FileInputStream("data2.txt");//Unicode格式 for (int i = 0; i < 5; i++) { System.out.println(fis.read()); } fis.close(); } }
文件里不是只有一个数字吗,为什么循环5次,什么鬼?稍后知晓,先看输出结果:
49
-1
-1
-1
-1
------------------
255
254
49
0
-1
结果怎么会是这样呢?
1.因为ANSI编码没有文件头,因此数字字符1只占一个字节,并且1的Ascii码为49因此输出49,而Unicode格式有2个字节的文件头,并且以2个字节表示一个字符,对于Ascii字符对应的字符则是第2位补0,因此1的Unicode码的两位十进制分别为49和0;
附:文本文件各格式文件头:ANSI类型:什么都没有,UTF-8类型:EF BB BF,UNICODE类型:FF FE,UNICODE BIG ENDIAN类型:FE FF
2.从返回的结果来看,返回的是当前的字节数据,API文档中原文为:“下一个数据字节,如果已到达文件末尾,则返回 -1。”(英文原文为:the next byte of data, or -1 if the end of the file is reached),应该理解成:此时的指针在下一个数据字节的开始位置。
3.2 read (byte[ ] b )
官方文档
public int read(byte[] b) throws IOException
从此输入流中将最多 b.length 个字节的数据读入一个 byte 数组中。在某些输入可用之前,此方法将阻塞。
覆盖:
类 InputStream 中的 read
参数:
b - 存储读取数据的缓冲区。
返回:
读入缓冲区的字节总数,如果因为已经到达文件末尾而没有更多的数据,则返回 -1。
解读:
- 最多b.length个字节的数据读入一个byte数据组中,即,最多将byte数组b填满;
- 返回读入缓冲的字节总数,如果因为已经到达文件末尾而没有更多的数据,则返回-1。这里即这为朋友的问题点,为什么用-1来判断文件的结束。他的理由为,假设3个字节源数据,用2个字节的数组来缓存,当第2次读取的时候到达了文件的结尾,此时应该返回-1了,岂不是只读取到了2个字节?
同样,我们来测试:
测试文件,data.txt,文件格式ANSI,文件内容123,测试代码:
import java.io.FileInputStream; import java.io.IOException; import java.util.Arrays; public class Test { public static void main(String[] args) throws IOException { FileInputStream fis = new FileInputStream("data.txt");//ANSI格式 byte[] b = new byte[2]; for (int i = 0; i < 3; i++) { System.out.print("第"+(i+1)+"次读取返回的结果:"+fis.read(b)); System.out.println(",读取后数组b的内容为:"+Arrays.toString(b)); } fis.close(); } }
输出结果:
第1次读取返回的结果:2,读取后数组b的内容为:[49, 50]
第2次读取返回的结果:1,读取后数组b的内容为:[51, 50]
第3次读取返回的结果:-1,读取后数组b的内容为:[51, 50]
测试数据文件采用的是ANSI格式,放入3个数字,因此为3个字节,这里测试读3次,从代码中可以看出,b为一个byte数组,大小为2,即每次可以存放2个字节。那么问题来了,第一次读取的时候读到2个字节返回很好理解,而第2次的时候,由于只剩下一个字节,此处到了文件的结尾,按照朋友对API文档的理解,应该返回-1才对?
让我们看看源码吧
public int read(byte b[]) throws IOException { return readBytes(b, 0, b.length); }
private native int readBytes(byte b[], int off, int len) throws IOException;
晴天霹雳,是个被native修饰的方法,因此没办法继续一步看代码了。没啥好说的,用个代码类继承FileInputStream,覆盖read(byte b)方法,看代码即能理解:
import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; public class MyFileInputStream extends FileInputStream{ public MyFileInputStream(String name) throws FileNotFoundException { super(name); } @Override public int read(byte[] b) throws IOException { int getData = read(); if (getData==-1) { return -1; }else{ b[0] = (byte)getData; for (int i = 1; i < b.length; i++) { getData = read(); if(-1==getData) return i; b[i] = (byte)getData; } } return b.length; } }
原测试代码做小小的改动:
import java.io.FileInputStream; import java.util.Arrays; public class Test { public static void main(String[] args) throws Exception { FileInputStream fis = new MyFileInputStream("data.txt");//ANSI格式 byte[] b = new byte[2]; for (int i = 0; i < 3; i++) { System.out.print("第"+(i+1)+"次读取返回的结果:"+fis.read(b)); System.out.println(",读取后数组b的内容为:"+Arrays.toString(b)); } fis.close(); } }
输出结果与原结果一致:
第1次读取返回的结果:2,读取后数组b的内容为:[49, 50]
第2次读取返回的结果:1,读取后数组b的内容为:[51, 50]
第3次读取返回的结果:-1,读取后数组b的内容为:[51, 50]
说明此方法内部调用的是read()方法一个个的来读数据。 如果第一个字节不是 -1 就会继续读,如果后续的read()返回的是-1 那么此方法就不会返回 - 1 返回的是i。
正确显示文本内容
import java.io.FileInputStream; public class Test { public static void main(String[] args) throws Exception { FileInputStream fis = new MyFileInputStream("data.txt");//ANSI格式 byte[] b = new byte[2]; int len ; while (-1!=(len = fis.read(b))) { System.out.println(new String(b,0,len)); } fis.close(); } }
3.3 available()方法
public int available();
方法的返回类型为int,它返回在解除阻塞期间可以从此FileInputStream读取的剩余可用字节数。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。