与其他语言相比,java的io功能显得复杂。在其他语言中,许多io功能(比如读取文件),是被封装好的,可以用一两行程序实现。在java中,程序员往往需要多个层次的装饰(decoration),才能实现文件读取。
初学java,一直搞不懂java里面的io关系,在网上找了很多大多都是给个结构图草草描述也看的不是很懂。而且没有结合到java7 的最新技术,所以自己来整理一下,有错的话请指正,也希望大家提出宝贵意见。
首先看个图:
这是java io 比较基本的一些处理流,除此之外我们还会提到一些比较深入的基于io的处理类,比如console类,steamtokenzier,externalizable接口,serializable接口等等一些高级用法极其原理。
一、java io的开始:文件
1. 我们主要讲的是流,流的本质也是对文件的处理,我们循序渐进一步一步从文件将到流去。
2. java 处理文件的类 file,java提供了十分详细的文件处理方法
package com.hxw.io; import java.io.*; public class fileexample{ public static void main(string[] args) { createfile(); } /** * 文件处理示例 */ public static void createfile() { file f=new file("e:/电脑桌面/jar/files/create.txt"); try{ f.createnewfile(); //当且仅当不存在具有此抽象路径名指定名称的文件时,不可分地创建一个新的空文件。 system.out.println("该分区大小"+f.gettotalspace()/(1024*1024*1024)+"g"); //返回由此抽象路径名表示的文件或目录的名称。 f.mkdirs(); //创建此抽象路径名指定的目录,包括所有必需但不存在的父目录。 // f.delete(); // 删除此抽象路径名表示的文件或目录 system.out.println("文件名 "+f.getname()); // 返回由此抽象路径名表示的文件或目录的名称。 system.out.println("文件父目录字符串 "+f.getparent());// 返回此抽象路径名父目录的路径名字符串;如果此路径名没有指定父目录,则返回 null。 }catch (exception e) { e.printstacktrace(); } } }
二、字节流:
1.字节流有输入和输出流,我们首先看输入流inputstream
package com.hxw.io; import java.io.file; import java.io.fileinputstream; import java.io.ioexception; import java.io.inputstream; public class filecount { /** * 我们写一个检测文件长度的小程序,别看这个程序挺长的,你忽略try catch块后发现也就那么几行而已。 */ publicstatic void main(string[] args) { //todo 自动生成的方法存根 int count=0; //统计文件字节长度 inputstreamstreamreader = null; //文件输入流 try{ streamreader=newfileinputstream(new file("d:/david/java/java 高级进阶/files/tiger.jpg")); /*1.new file()里面的文件地址也可以写成d:\\david\\java\\java 高级进阶\\files\\tiger.jpg,前一个\是用来对后一个 * 进行转换的,fileinputstream是有缓冲区的,所以用完之后必须关闭,否则可能导致内存占满,数据丢失。 */ while(streamreader.read()!=-1) { //读取文件字节,并递增指针到下一个字节 count++; } system.out.println("---长度是: "+count+" 字节"); }catch (final ioexception e) { //todo 自动生成的 catch 块 e.printstacktrace(); }finally{ try{ streamreader.close(); }catch (ioexception e) { //todo 自动生成的 catch 块 e.printstacktrace(); } } } }
我们一步一步来,首先,上面的程序存在问题是,每读取一个自己我都要去用到fileinputstream,我输出的结果是“---长度是: 64982 字节”,那么进行了64982次操作!可能想象如果文件十分庞大,这样的操作肯定会出大问题,所以引出了缓冲区的概念。可以将streamreader.read()改成streamreader.read(byte[]b)此方法读取的字节数目等于字节数组的长度,读取的数据被存储在字节数组中,返回读取的字节数,inputstream还有其他方法mark,reset,marksupported方法,例如:
marksupported 判断该输入流能支持mark 和 reset 方法。
mark用于标记当前位置;在读取一定数量的数据(小于readlimit的数据)后使用reset可以回到mark标记的位置。
fileinputstream不支持mark/reset操作;bufferedinputstream支持此操作;
mark(readlimit)的含义是在当前位置作一个标记,制定可以重新读取的最大字节数,也就是说你如果标记后读取的字节数大于readlimit,你就再也回不到回来的位置了。
通常inputstream的read()返回-1后,说明到达文件尾,不能再读取。除非使用了mark/reset。
2.fileoutputstream 循序渐进版, inputstream是所有字节输出流的父类,子类有bytearrayoutputstream,fileoutputstream,objectoutputstreanm,这些我们在后面都会一一说到。先说fileoutputstream
我以一个文件复制程序来说,顺便演示一下缓存区的使用。(java i/o默认是不缓冲流的,所谓“缓冲”就是先把从流中得到的一块字节序列暂存在一个被称为buffer的内部字节数组里,然后你可以一下子取到这一整块的字节数据,没有缓冲的流只能一个字节一个字节读,效率孰高孰低一目了然。有两个特殊的输入流实现了缓冲功能,一个是我们常用的bufferedinputstream.)
package com.hxw.io; import java.io.*; public class filecopy { public static void main(string[] args) { // todo自动生成的方法存根 byte[] buffer=new byte[512]; //一次取出的字节数大小,缓冲区大小 int numberread=0; fileinputstream input=null; fileoutputstream out =null; try { input=new fileinputstream("d:/david/java/java 高级进阶/files/tiger.jpg"); out=new fileoutputstream("d:/david/java/java 高级进阶/files/tiger2.jpg"); //如果文件不存在会自动创建 while ((numberread=input.read(buffer))!=-1) { //numberread的目的在于防止最后一次读取的字节小于buffer长度, out.write(buffer, 0, numberread); //否则会自动被填充0 } } catch (final ioexception e) { // todo自动生成的 catch 块 e.printstacktrace(); }finally{ try { input.close(); out.close(); } catch (ioexception e) { // todo自动生成的 catch 块 e.printstacktrace(); } } } }
3.读写对象:objectinputstream 和objectoutputstream ,该流允许读取或写入用户自定义的类,但是要实现这种功能,被读取和写入的类必须实现serializable接口,其实该接口并没有什么方法,可能相当于一个标记而已,但是确实不合缺少的。实例代码如下:
package com.hxw.io; import java.io.*; public class objetstream { /** * @param args */ public static void main(string[] args) { // todo自动生成的方法存根 objectoutputstream objectwriter=null; objectinputstream objectreader=null; try { objectwriter=new objectoutputstream(new fileoutputstream("d:/david/java/java 高级进阶/files/student.txt")); objectwriter.writeobject(new student("gg", 22)); objectwriter.writeobject(new student("tt", 18)); objectwriter.writeobject(new student("rr", 17)); objectreader=new objectinputstream(new fileinputstream("d:/david/java/java 高级进阶/files/student.txt")); for (int i = 0; i < 3; i++) { system.out.println(objectreader.readobject()); } } catch (ioexception | classnotfoundexception e) { // todo自动生成的 catch 块 e.printstacktrace(); }finally{ try { objectreader.close(); objectwriter.close(); } catch (ioexception e) { // todo自动生成的 catch 块 e.printstacktrace(); } } } } class student implements serializable{ private string name; private int age; public student(string name, int age) { super(); this.name = name; this.age = age; } @override public string tostring() { return "student [name=" + name + ", age=" + age + "]"; } }
运行后系统输出:
student [name=gg, age=22]
student [name=tt, age=18]
student [name=rr, age=17]
4.有时没有必要存储整个对象的信息,而只是要存储一个对象的成员数据,成员数据的类型假设都是java的基本数据类型,这样的需求不必使用到与object输入、输出相关的流对象,可以使用datainputstream、dataoutputstream来写入或读出数据。下面是一个例子:(datainputstream的好处在于在从文件读出数据时,不用费心地自行判断读入字符串时或读入int类型时何时将停止,使用对应的readutf()和readint()方法就可以正确地读入完整的类型数据。)
package com.hxw; public class member { private string name; private int age; public member() { } public member(string name, int age) { this.name = name; this.age = age; } public void setname(string name){ this.name = name; } public void setage(int age) { this.age = age; } public string getname() { return name; } public int getage() { return age; } }
打算将member类实例的成员数据写入文件中,并打算在读入文件数据后,将这些数据还原为member对象。下面的代码简单示范了如何实现这个需求。
package com.hxw; import java.io.*; public class datastreamdemo { public static void main(string[]args) { member[] members = {newmember("justin",90), newmember("momor",95), newmember("bush",88)}; try { dataoutputstreamdataoutputstream = new dataoutputstream(new fileoutputstream(args[0])); for(member member:members) { //写入utf字符串 dataoutputstream.writeutf(member.getname()); //写入int数据 dataoutputstream.writeint(member.getage()); } //所有数据至目的地 dataoutputstream.flush(); //关闭流 dataoutputstream.close(); datainputstreamdatainputstream = new datainputstream(new fileinputstream(args[0])); //读出数据并还原为对象 for(inti=0;i<members.length;i++) { //读出utf字符串 string name =datainputstream.readutf(); //读出int数据 int score =datainputstream.readint(); members[i] = newmember(name,score); } //关闭流 datainputstream.close(); //显示还原后的数据 for(member member : members) { system.out.printf("%s\t%d%n",member.getname(),member.getage()); } } catch(ioexception e) { e.printstacktrace(); } } }
5.pushbackinputstream类继承了filterinputstream类是iputstream类的修饰者。提供可以将数据插入到输入流前端的能力(当然也可以做其他操作)。简而言之pushbackinputstream类的作用就是能够在读取缓冲区的时候提前知道下一个字节是什么,其实质是读取到下一个字符后回退的做法,这之间可以进行很多操作,这有点向你把读取缓冲区的过程当成一个数组的遍历,遍历到某个字符的时候可以进行的操作,当然,如果要插入,能够插入的最大字节数是与推回缓冲区的大小相关的,插入字符肯定不能大于缓冲区吧!下面是一个示例。
package com.hxw.io; import java.io.bytearrayinputstream; //导入bytearrayinputstream的包 import java.io.ioexception; import java.io.pushbackinputstream; /** * 回退流操作 * */ public class pushbackinputstreamdemo { public static void main(string[] args) throws ioexception { string str = "hello,rollenholt"; pushbackinputstream push = null; // 声明回退流对象 bytearrayinputstream bat = null; // 声明字节数组流对象 bat = new bytearrayinputstream(str.getbytes()); push = new pushbackinputstream(bat); // 创建回退流对象,将拆解的字节数组流传入 int temp = 0; while ((temp = push.read()) != -1) { // push.read()逐字节读取存放在temp中,如果读取完成返回-1 if (temp == ',') { // 判断读取的是否是逗号 push.unread(temp); //回到temp的位置 temp = push.read(); //接着读取字节 system.out.print("(回退" + (char) temp + ") "); // 输出回退的字符 } else { system.out.print((char) temp); // 否则输出字符 } } } }
6.sequenceinputstream:有些情况下,当我们需要从多个输入流中向程序读入数据。此时,可以使用合并流,将多个输入流合并成一个sequenceinputstream流对象。sequenceinputstream会将与之相连接的流集组合成一个输入流并从第一个输入流开始读取,直到到达文件末尾,接着从第二个输入流读取,依次类推,直到到达包含的最后一个输入流的文件末尾为止。 合并流的作用是将多个源合并合一个源。其可接收枚举类所封闭的多个字节流对象。
package com.hxw.io; import java.io.*; import java.util.enumeration; import java.util.vector; public class sequenceinputstreamtest { /** * @param args * sequenceinputstream合并流,将与之相连接的流集组合成一个输入流并从第一个输入流开始读取, * 直到到达文件末尾,接着从第二个输入流读取,依次类推,直到到达包含的最后一个输入流的文件末尾为止。 * 合并流的作用是将多个源合并合一个源。可接收枚举类所封闭的多个字节流对象。 */ public static void main(string[] args) { dosequence(); } private static void dosequence() { // 创建一个合并流的对象 sequenceinputstream sis = null; // 创建输出流。 bufferedoutputstream bos = null; try { // 构建流集合。 vector<inputstream> vector = new vector<inputstream>(); vector.addelement(new fileinputstream("d:\text1.txt")); vector.addelement(new fileinputstream("d:\text2.txt")); vector.addelement(new fileinputstream("d:\text3.txt")); enumeration<inputstream> e = vector.elements(); sis = new sequenceinputstream(e); bos = new bufferedoutputstream(new fileoutputstream("d:\text4.txt")); // 读写数据 byte[] buf = new byte[1024]; int len = 0; while ((len = sis.read(buf)) != -1) { bos.write(buf, 0, len); bos.flush(); } } catch (filenotfoundexception e1) { e1.printstacktrace(); } catch (ioexception e1) { e1.printstacktrace(); } finally { try { if (sis != null) sis.close(); } catch (ioexception e) { e.printstacktrace(); } try { if (bos != null) bos.close(); } catch (ioexception e) { e.printstacktrace(); } } } }
7.printstream 说这个名字可能初学者不熟悉,如果说system.out.print()你肯定熟悉,system.out这个对象就是printstream,这个我们不做过多示例
三、字符流(顾名思义,就是操作字符文件的流)
1.java 使用unicode存储字符串,在写入字符流时我们都可以指定写入的字符串的编码。前面介绍了不用抛异常的处理字节型数据的流bytearrayoutputstream,与之对应的操作字符类的类就是chararrayreader,chararraywriter类,这里也会用到缓冲区,不过是字符缓冲区,一般讲字符串放入到操作字符的io流一般方法是
chararrayreaderreader=mew chararrayreader(str.tochararray()); 一旦会去到chararrayreader实例就可以使用chararrayreader访问字符串的各个元素以执行进一步读取操作。不做例子
2.我们用filereader ,printwriter来做示范
package com.hxw.io; import java.io.filenotfoundexception; import java.io.filereader; import java.io.ioexception; import java.io.printwriter; import java.nio.charbuffer; public class print { /** * @param args */ public static void main(string[] args) { // todo自动生成的方法存根 char[] buffer=new char[512]; //一次取出的字节数大小,缓冲区大小 int numberread=0; filereader reader=null; //读取字符文件的流 printwriter writer=null; //写字符到控制台的流 try { reader=new filereader("d:/david/java/java 高级进阶/files/copy1.txt"); writer=new printwriter(system.out); //printwriter可以输出字符到文件,也可以输出到控制台 while ((numberread=reader.read(buffer))!=-1) { writer.write(buffer, 0, numberread); } } catch (ioexception e) { // todo自动生成的 catch 块 e.printstacktrace(); }finally{ try { reader.close(); } catch (ioexception e) { // todo自动生成的 catch 块 e.printstacktrace(); } writer.close(); //这个不用抛异常 } } }
3.相对我们前面的例子是直接用filereader打开的文件,我们这次使用链接流,一般比较常用的都用链接流,所谓链接流就是就多次对流的封装,这样能更好的操作个管理数据,(比如我们利用datainputstream(bufferedinputstream(fileinputstream))将字节流层层包装后,我们可以读取readbyte(),readchar()这样更加具体的操作,注意,该流属于字节流对字符进行操作,)字符流用chararrayreader就可以了。下面的示例我们将用到j2se 5中的一个可变参数进行一个小度扩展。使用bufferedwriter 和bufferedreader用文件级联的方式进行写入,即将多个文件写入到同一文件中(自带缓冲区的输出输出流bufferedreader和bufferedwriter,该流最常用的属readline()方法了,读取一行数据,并返回string)。
package com.hxw.io; import java.io.bufferedreader; import java.io.bufferedwriter; import java.io.filereader; import java.io.filewriter; import java.io.ioexception; import java.util.iterator; public class fileconcatenate { /** * 包装类进行文件级联操作 */ public static void main(string[] args) { // todo自动生成的方法存根 try { concennatefile(args); } catch (ioexception e) { // todo自动生成的 catch 块 e.printstacktrace(); } } public static voidconcennatefile(string...filename) throws ioexception{ string str; //构建对该文件您的输入流 bufferedwriter writer=new bufferedwriter(new filewriter("d:/david/java/java 高级进阶/files/copy2.txt")); for(string name: filename){ bufferedreader reader=new bufferedreader(new filereader(name)); while ((str=reader.readline())!=null) { writer.write(str); writer.newline(); } } } }
4.console类,该类提供了用于读取密码的方法,可以禁止控制台回显并返回char数组,对两个特性对保证安全有作用,平时用的不多,了解就行。
5.streamtokenizer 类,这个类非常有用,它可以把输入流解析为标记(token), streamtokenizer 并非派生自inputstream或者outputstream,而是归类于io库中,因为streamtokenizer只处理inputstream对象。
首先给出我的文本文件内容:
'水上漂'
青青草
"i love wyhss"
{3211}
23223 3523
i love wyh ,。
. ,
下面是代码:
package com.hxw.io; import java.io.bufferedreader; import java.io.filereader; import java.io.ioexception; import java.io.streamtokenizer; /** * 使用streamtokenizer来统计文件中的字符数 * streamtokenizer 类获取输入流并将其分析为“标记”,允许一次读取一个标记。 * 分析过程由一个表和许多可以设置为各种状态的标志控制。 * 该流的标记生成器可以识别标识符、数字、引用的字符串和各种注释样式。 * * 默认情况下,streamtokenizer认为下列内容是token: 字母、数字、除c和c++注释符号以外的其他符号。 * 如符号"/"不是token,注释后的内容也不是,而"\"是token。单引号和双引号以及其中的内容,只能算是一个token。 * 统计文章字符数的程序,不是简单的统计token数就万事大吉,因为字符数不等于token。按照token的规定, * 引号中的内容就算是10页也算一个token。如果希望引号和引号中的内容都算作token,应该调用下面的代码: * st.ordinarychar('\''); * st.ordinarychar('\"'); */ public class streamtokenizerexample { /** * 统计字符数 * @param filename 文件名 * @return 字符数 */ public static void main(string[] args) { string filename = "d:/david/java/java 高级进阶/files/copy1.txt"; streamtokenizerexample.statis(filename); } public static long statis(string filename) { filereader filereader = null; try { filereader = new filereader(filename); //创建分析给定字符流的标记生成器 streamtokenizer st = new streamtokenizer(new bufferedreader( filereader)); //ordinarychar方法指定字符参数在此标记生成器中是“普通”字符。 //下面指定单引号、双引号和注释符号是普通字符 st.ordinarychar('\''); st.ordinarychar('\"'); st.ordinarychar('/'); string s; int numbersum = 0; int wordsum = 0; int symbolsum = 0; int total = 0; //nexttoken方法读取下一个token. //tt_eof指示已读到流末尾的常量。 while (st.nexttoken() !=streamtokenizer.tt_eof) { //在调用 nexttoken 方法之后,ttype字段将包含刚读取的标记的类型 switch (st.ttype) { //tt_eol指示已读到行末尾的常量。 case streamtokenizer.tt_eol: break; //tt_number指示已读到一个数字标记的常量 case streamtokenizer.tt_number: //如果当前标记是一个数字,nval字段将包含该数字的值 s = string.valueof((st.nval)); system.out.println("数字有:"+s); numbersum ++; break; //tt_word指示已读到一个文字标记的常量 case streamtokenizer.tt_word: //如果当前标记是一个文字标记,sval字段包含一个给出该文字标记的字符的字符串 s = st.sval; system.out.println("单词有: "+s); wordsum ++; break; default: //如果以上3中类型都不是,则为英文的标点符号 s = string.valueof((char) st.ttype); system.out.println("标点有: "+s); symbolsum ++; } } system.out.println("数字有 " + numbersum+"个"); system.out.println("单词有 " + wordsum+"个"); system.out.println("标点符号有: " + symbolsum+"个"); total = symbolsum + numbersum +wordsum; system.out.println("total = " + total); return total; } catch (exception e) { e.printstacktrace(); return -1; } finally { if (filereader != null) { try { filereader.close(); } catch (ioexception e1) { } } } } }
运行结果为:
标点有: '
单词有: 水上漂
标点有: '
单词有: 青青草
标点有:
单词有: i
单词有: love
单词有: wyh
单词有: ss
标点有:
标点有: {
数字有:3211.0
标点有: }
数字有:23223.0
数字有:35.23
单词有: i
单词有: love
单词有: wyh
单词有: ,。
数字有:0.0
标点有: ,
数字有 4个
单词有 10个
标点符号有: 7个
total= 21
我们从其中可以看到很多东西:
1.一个单独的小数点“.”是被当做一个数字来对待的,数字的值为0.0;
2.一串汉字只要中间没有符号(空格回车 分号等等)都是被当做一个单词的。中文的标点跟中文的汉字一样处理
3.如果不对引号化成普通字符,一个引号内的内容不论多少都被当做是一个标记。
4.该类能够识别英文标点
