当前位置：文档库 › JVM之用Java解析class文件

JVM之用Java解析class文件

前言：

身为一个Java程序员，怎么能不了解JVM呢，倘若想学习JVM，那就又必须要了解Class 文件，Class之于虚拟机，就如鱼之于水，虚拟机因为Class而有了生命。《深入理解java 虚拟机》中花了一整个章节来讲解Class文件，可是看完后，一直都还是迷迷糊糊，似懂非懂。正好前段时间看见一本书很不错：《自己动手写Java虚拟机》，作者利用go语言实现了一个简单的JVM，虽然没有完整实现JVM的所有功能，但是对于一些对JVM稍感兴趣的人来说，可读性还是很高的。作者讲解的很详细，每个过程都分为了一章，其中一部分就是讲解如何解析Class文件。

这本书不太厚，很快就读完了，读完后，收获颇丰。但是纸上得来终觉浅，绝知此事要躬行，我便尝试着自己解析Class文件。go语言虽然很优秀，但是终究不熟练，尤其是不太习惯其把类型放在变量之后的语法，还是老老实实用java吧。

话不多说，先贴出项目地址：https://https://www.wendangku.net/doc/d110309141.html,/HalfStackDeveloper/ClassReader Class文件

什么是Class文件？

java之所以能够实现跨平台，便在于其编译阶段不是将代码直接编译为平台相关的机器语言，而是先编译成二进制形式的java字节码，放在Class文件之中，虚拟机再加载Class 文件，解析出程序运行所需的内容。每个类都会被编译成一个单独的class文件，内部类也会作为一个独立的类，生成自己的class。

基本结构

随便找到一个class文件，用Sublime Text打开是这样的：

是不是一脸懵逼，不过java虚拟机规范中给出了class文件的基本格式，只要按照这个格式去解析就可以了：

ClassFile {

u4 magic;

u2 minor_version;

u2 major_version;

u2 constant_pool_count;

cp_info constant_pool[constant_pool_count-1];

u2 access_flags;

u2 this_class;

u2 super_class;

u2 interfaces_count;

u2 interfaces[interfaces_count];

u2 fields_count;

field_info fields[fields_count];

u2 methods_count;

method_info methods[methods_count];

u2 attributes_count;

attribute_info attributes[attributes_count];

}

ClassFile中的字段类型有u1、u2、u4,这是什么类型呢？其实很简单，就是分别表示1个字节，2个字节和4个字节。

开头四个字节为：magic，是用来唯一标识文件格式的，一般被称作magic number（魔数），这样虚拟机才能识别出所加载的文件是否是class格式，class文件的魔数为cafebabe。不只是class文件，基本上大部分文件都有魔数，用来标识自己的格式。

接下来的部分主要是class文件的一些信息，如常量池、类访问标志、父类、接口信息、字段、方法等，具体的信息可参考《Java虚拟机规范》。

解析

字段类型

上面说到ClassFile中的字段类型有u1、u2、u4，分别表示1个字节，2个字节和4个字节的无符号整数。java中short、int、long分别为2、4、8个字节的有符号整数，去掉符号位，刚好可以用来表示u1、u2、u4。

public class U1 {

public static short read(InputStream inputStream) {

byte[] bytes = new byte[1];

try {

inputStream.read(bytes);

} catch (IOException e) {

e.printStackTrace();

}

short value = (short) (bytes[0] & 0xFF);

return value;

}

public class U2 {

public static int read(InputStream inputStream) {

byte[] bytes = new byte[2];

try {

inputStream.read(bytes);

} catch (IOException e) {

e.printStackTrace();

}

int num = 0;

for (int i= 0; i < bytes.length; i++) {

num <<= 8;

num |= (bytes[i] & 0xff);

}

return num;

}

} public class U4 {

public static long read(InputStream inputStream) {

byte[] bytes = new byte[4];

try {

inputStream.read(bytes);

} catch (IOException e) {

e.printStackTrace();

}

long num = 0;

for (int i= 0; i < bytes.length; i++) {

num <<= 8;

num |= (bytes[i] & 0xff);

}

return num;

}

常量池

定义好字段类型后，我们就可以读取class文件了，首先是读取魔数之类的基本信息，这部分很简单：

FileInputStream inputStream = new FileInputStream(file); ClassFile classFile = new ClassFile();

classFile.magic = U4.read(inputStream);

classFile.minorVersion = U2.read(inputStream);

classFile.majorVersion = U2.read(inputStream);

这部分只是热热身，接下来的大头在于常量池。解析常量池之前，我们先来解释一下常量池是什么。

常量池，顾名思义，存放常量的资源池，这里的常量指的是字面量和符号引用。字面量指的是一些字符串资源，而符号引用分为三类：类符号引用、方法符号引用和字段符号引用。通过将资源放在常量池中，其他项就可以直接定义成常量池中的索引了，避免了空间的浪费，不只是class文件，Android可执行文件dex也是同样如此，将字符串资源等放在DexData 中，其他项通过索引定位资源。java虚拟机规范给出了常量池中每一项的格式：

cp_info {

u1 tag;

u1 info[];

}

上面的这个格式只是一个通用格式，常量池中真正包含的数据有14种格式，每种格式的tag 值不同,具体如下所示:

由于格式太多，文章中只挑选一部分讲解：

这里首先读取常量池的大小，初始化常量池：

//解析常量池

int constant_pool_count = U2.read(inputStream);

ConstantPool constantPool = new ConstantPool(constant_pool_count);

constantPool.read(inputStream);

接下来再逐个读取每项内容，并存储到数组cpInfo中，这里需要注意的是，cpInfo[]下标从1开始，0无效，且真正的常量池大小为constant_pool_count-1。

public class ConstantPool {

public int constant_pool_count;

public ConstantInfo[] cpInfo;

public ConstantPool(int count) {

constant_pool_count = count;

cpInfo = new ConstantInfo[constant_pool_count];

}

public void read(InputStream inputStream) {

for (int i = 1; i < constant_pool_count; i++) {

short tag = U1.read(inputStream);

ConstantInfo constantInfo = ConstantInfo.getConstantInfo(tag);

constantInfo.read(inputStream);

cpInfo[i] = constantInfo;

if (tag == ConstantInfo.CONSTANT_Double || tag == ConstantInfo.CONSTANT_Long) {

i++;

}

我们先来看看CONSTANT_Utf8格式，这一项里面存放的是MUTF-8编码的字符串：CONSTANT_Utf8_info {

u1 tag;

u2 length;

u1 bytes[length];

}

那么如何读取这一项呢？

public class ConstantUtf8 extends ConstantInfo {

public String value;

@Override

public void read(InputStream inputStream) {

int length = U2.read(inputStream);

byte[] bytes = new byte[length];

try {

inputStream.read(bytes);

} catch (IOException e) {

e.printStackTrace();

}

try {

value = readUtf8(bytes);

} catch (UTFDataFormatException e) {

e.printStackTrace();

}

private String readUtf8(byte[] bytearr) throws UTFDataFormatException {

//copy from java.io.DataInputStream.readUTF()

}

很简单，首先读取这一项的字节数组长度，接着调用readUtf8(),将字节数组转化为String 字符串。

再来看看CONSTANT_Class这一项，这一项存储的是类或者接口的符号引用：CONSTANT_Class_info {

u1 tag;

u2 name_index;

}

注意这里的name_index并不是直接的字符串，而是指向常量池中cpInfo数组的name_index项，且cpInfo[name_index]一定是CONSTANT_Utf8格式。

public class ConstantClass extends ConstantInfo {

public int nameIndex;

@Override

public void read(InputStream inputStream) {

nameIndex = U2.read(inputStream);

}

常量池解析完毕后，就可以供后面的数据使用了，比方说ClassFile中的this_class指向的就是常量池中格式为CONSTANT_Class的某一项,那么我们就可以读取出类名：

int classIndex = U2.read(inputStream);

ConstantClass clazz = (ConstantClass) constantPool.cpInfo[classIndex];

ConstantUtf8 className = (ConstantUtf8) constantPool.cpInfo[https://www.wendangku.net/doc/d110309141.html,Index];

classFile.className = className.value;

System.out.print("classname:" + classFile.className + "\n");

字节码指令

解析常量池之后还需要接着解析一些类信息，如父类、接口类、字段等，但是相信大家最好奇的还是java指令的存储，大家都知道，我们平时写的java代码会被编译成java字节码，

那么这些字节码到底存储在哪呢？别急，讲解指令之前，我们先来了解下ClassFile中的method_info，其格式如下：

method_info {

u2 access_flags;

u2 name_index;

u2 descriptor_index;

u2 attributes_count;

attribute_info attributes[attributes_count];

}

method_info里主要是一些方法信息：如访问标志、方法名索引、方法描述符索引及属性数组。这里要强调的是属性数组，因为字节码指令就存储在这个属性数组里。属性有很多种，比如说异常表就是一个属性，而存储字节码指令的属性为CODE属性，看这名字也知道是用来存储代码的了。属性的通用格式为：

attribute_info {

u2 attribute_name_index;

u4 attribute_length;

u1 info[attribute_length];

}

根据attribute_name_index可以从常量池中拿到属性名，再根据属性名就可以判断属性种类了。

Code属性的具体格式为：

Code_attribute {

u2 attribute_name_index; u4 attribute_length;

u2 max_stack;

u2 max_locals;

u4 code_length;

u1 code[code_length];

u2 exception_table_length;

{

u2 start_pc;

u2 end_pc;

u2 handler_pc;

u2 catch_type;

} exception_table[exception_table_length];

u2 attributes_count;

attribute_info attributes[attributes_count];

}

其中code数组里存储就是字节码指令，那么如何解析呢？每条指令在code[]中都是一个字节，我们平时javap命令反编译看到的指令其实是助记符，只是方便阅读字节码使用的，jvm有一张字节码与助记符的对照表，根据对照表，就可以将指令翻译为可读的助记符了。这里我也是在网上随便找了一个对照表，保存到本地txt文件中，并在使用时解析成HashMap。代码很简单，就不贴了，可以参考我代码中InstructionTable.java。

接下来我们就可以解析字节码了：

for (int j = 0; j < methodInfo.attributesCount; j++) {

if (methodInfo.attributes[j] instanceof CodeAttribute) { CodeAttribute codeAttribute = (CodeAttribute) methodInfo.attributes[j];

for (int m = 0; m < codeAttribute.codeLength; m++) {

short code = codeAttribute.code[m];

System.out.print(InstructionTable.getInstruction(co de) + "\n");

}

运行

整个项目终于写完了，接下来就来看看效果如何，随便找一个class文件解析运行：

哈哈，是不是很赞！

由于篇幅限制，本文中只选取了一部分解析过程讲解，感兴趣的同学可参考我的github项目：https://https://www.wendangku.net/doc/d110309141.html,/HalfStackDeveloper/ClassReader，欢迎Fork And Star！

总结

Class文件看起来很复杂，其实真正解析起来，也没有那么难，关键是要自己动手试试，才能彻底理解，希望各位看完后也能觉知此事要躬行！

Dom4j遍历解析XML测试

Dom4j遍历解析XML测试近来老和XML打交道，不深挖不行了。。这是一个Dom4j解析XML的例子，为做复杂递归处理前期所写的例子。涵盖了XML的解析方面大部分核心API。环境： Dom4j-1.6.1 Dom4j解析需要XML需要的最小类库为： dom4j-1.6.1.jar jaxen-1.1-beta-6.jar 目标：解析一个xml，输出所有的属性和元素值。测试代码： XML文件： zhangsan 32 home add com add lisi 22 home add com add com add

解析代码： package com.topsoft.test; import org.dom4j.io.SAXReader; import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.Element; import org.dom4j.Node; import java.util.Iterator; import java.util.List; import java.io.InputStream; /** * Created by IntelliJ IDEA.
* User: leizhimin
* Date: 2008-3-26 15:53:51
* Note: Dom4j遍历解析XML测试 */ public class TestDom4j { /** * 获取指定xml文档的Docum ent对象,xml文件必须在classpath中可以找到 * * @param xmlFilePath xml文件路径 * @return Document对象 */ public static Docum ent parse2Document(String xmlFilePath) { SAXReader reader = new SAXReader(); Docum ent docum ent = null; try { InputStream in =TestDom4j.class.getResourceAsStream(xmlFilePath); docum ent =reader.read(in); } catch (Docum entException e) { System.out.println(e.getMessage()); System.out.println("读取classpath下xmlFileName文件发生异常，请检查CL ASSPATH和文件名是否存在！"); e.printStackTrace(); }

java解析FSN文件

package action; import java.util.ArrayList; import tools.FsnTools; import bean.FsnBody; import bean.FsnModel; public class FsnReaderAction { public final static int intstep=2; //Uint16字节长度 public final static int stringstep=4; //Uint32字节长度 public final static int fsnHeadLengh=32;//fsn文件头字节长度 public final static int fsnPerBodyNoImg=100; //fsn文件体每条记录，不包括图像信息的字节长度 public final static int fsnPerBodyImg=1644; //fsn文件体每条记录，包括图像信息的字节长度 public int filePos=0; //fsn文件字节流当前指针位置 public FsnModel fm; //本实例解析的FsnMedel对象 public String fsnFilePath ;//FSN文件的存储完整路径，包括文件名 public FsnReaderAction(String filePath){ this.fsnFilePath=filePath; } public FsnModel readFsnFile() throws Exception { // FsnModel ret=null; try{ this.fm=new FsnModel(this.fsnFilePath); //hzyimport 把文件转成字节流数组 byte[] fsnbytes =FsnTools.toByteArray(this.fsnFilePath); this.fm.setSize(fsnbytes.length); System.out.println("File Lengh: "+fsnbytes.length); // 读取头文件 setHead(fsnbytes); long counter = this.fm.getCounter(); // 冠字号信息条数// System.out.println("this.fm.getHeadString()[2]="+this.fm.getHeadStr ing()[2]); int size = this.fm.getHeadString()[2] != 0x2D ? fsnPerBodyImg: fsnPerBodyNoImg; // System.out.println("this.fm.getHeadString()[2] ="+this.fm.getHeadString()[2] ); // System.out.println("counter ="+counter); // System.out.println("size="+size); // System.out.println("counter =* size"+counter * size); // System.out.println("fsnHeadLengh="+fsnHeadLengh);

java_Dom4j解析XML详解

学习：Dom4j 1、DOM4J简介 DOM4J是https://www.wendangku.net/doc/d110309141.html, 出品的一个开源XML 解析包。DOM4J应用于Java 平台，采用了Java 集合框架并完全支持DOM，SAX 和JAXP。 DOM4J 使用起来非常简单。只要你了解基本的XML-DOM 模型，就能使用。 Dom：把整个文档作为一个对象。 DOM4J 最大的特色是使用大量的接口。它的主要接口都在org.dom4j里面定义：

接口之间的继承关系如下： interface https://www.wendangku.net/doc/d110309141.html,ng.Cloneable interface org.dom4j.Node interface org.dom4j.Attribute interface org.dom4j.Branch interface org.dom4j.Document interface org.dom4j.Element interface org.dom4j.CharacterData interface org.dom4j.CDATA interface https://www.wendangku.net/doc/d110309141.html,ment interface org.dom4j.Text interface org.dom4j.DocumentType interface org.dom4j.Entity interface org.dom4j.ProcessingInstruction 2、XML文档操作1 2.1、读取XML文档：读写XML文档主要依赖于org.dom4j.io包，有DOMReader和SAXReader两种方式。因为利用了相同的接口，它们的调用方式是一样的。 public static Docum ent load(String filenam e) { Document docum ent =null; try { SAXReader saxReader = new SAXReader(); docum ent =saxReader.read(new File(filename)); //读取XML文件,获得docum ent 对象 } catch (Exception ex) { ex.printStackTrace();

java操作word可操作书签

最近有个需求，在word模板文档上设置书签，然后从数据库中查询数据，填充到word 文档书签位置,刚拿到需求时，使劲在网上找资料。幻想第三方jar包，帮我实现。有Apatch 的POI,java2word,jcob等，一直让我无法实现。POI操作word只能获取word中的书签，并不能进行操作.java2word可以实现，但是除了包以外，还要一个dll文件放在system32文件夹下,环境部署在linux服务器上，谁允许你放这样的文件，结果死心了.下面新建一个word2007文件告诉大家不用第三方技术怎么一一实现。现在新建一个word,在请输入用户名处添加书签userName,请输入年龄处添加书签age Word2007版本其实就是zip格式，将新建word后缀名改.zip,解压会发现，里面全是文件夹,打开word文件夹会有一个文件，在word所有内容，都在这xml文件中, 请输入用户名这是新建书签处的内容，细心的会发现，书签处内容在标签之间，标签中的w:id跟w:name 标识书签的唯一，中间是书签处的内容，会不会可以这样呢，找到用dom或者sax解析这个xml文档找到标签，然后找到标签，再找到标签里面的标签内容，替换就Ok了呢。一开始我就这样想的。但是你会发现，不是这样配套的，如果是这样配套的，那按照前面的说的直接解析找到标签就OK了。分析xml文件你会发现，其实标签跟标签是同级的，只是结束方式不同而已，所以算是兄弟节点，可以不可以找到的兄弟节点，也就是标签，然后找到标签，替换其文本。其实w3c中Element对象中提供了获取兄弟节点的方法，getNextSibling()获取下一个兄弟节点。按照分析的思路是可以实现的。但是会不会有疑问，如果的下一个兄弟节点会不会不是标签呢，是的，如果书签处无内容，就会是这样的

XML的四种解析器(dom,sax,jdom,dom4j)原理及性能比较[收藏]

1）DOM(JAXP Crimson解析器) DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。DOM 是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。分析该结构通常需要加载整个文档和构造层次结构，然后才能做任何工作。由于它是基于信息层次的，因而DOM被认为是基于树或基于对象的。DOM以及广义的基于树的处理具有几个优点。首先，由于树在内存中是持久的，因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任何时候在树中上下导航，而不是像SAX那样是一次性的处理。DOM使用起来也要简单得多。 2）SAX SAX处理的优点非常类似于流媒体的优点。分析能够立即开始，而不是等待所有的数据被处理。而且，由于应用程序只是在读取数据时检查数据，因此不需要将数据存储在内存中。这对于大型文档来说是个巨大的优点。事实上，应用程序甚至不必解析整个文档；它可以在某个条件得到满足时停止解析。一般来说，SAX还比它的替代者DOM快许多。选择DOM还是选择SAX？对于需要自己编写代码来处理XML文档的开发人员来说，选择DOM还是SAX解析模型是一个非常重要的设计决策。DOM 采用建立树形结构的方式访问XML文档，而SAX采用的事件模型。 DOM解析器把XML文档转化为一个包含其内容的树，并可以对树进行遍历。用DOM解析模型的优点是编程容易，开发人员只需要调用建树的指令，然

后利用navigation APIs访问所需的树节点来完成任务。可以很容易的添加和修改树中的元素。然而由于使用DOM解析器的时候需要处理整个XML文档，所以对性能和内存的要求比较高，尤其是遇到很大的XML文件的时候。由于它的遍历能力，DOM解析器常用于XML文档需要频繁的改变的服务中。 SAX解析器采用了基于事件的模型，它在解析XML文档的时候可以触发一系列的事件，当发现给定的tag的时候，它可以激活一个回调方法，告诉该方法制定的标签已经找到。SAX对内存的要求通常会比较低，因为它让开发人员自己来决定所要处理的tag。特别是当开发人员只需要处理文档中所包含的部分数据时，SAX这种扩展能力得到了更好的体现。但用SAX解析器的时候编码工作会比较困难，而且很难同时访问同一个文档中的多处不同数据。 3）JDOM https://www.wendangku.net/doc/d110309141.html,/ JDOM的目的是成为Java特定文档模型，它简化与XML的交互并且比使用DOM实现更快。由于是第一个Java特定模型，JDOM一直得到大力推广和促进。正在考虑通过“Java规范请求JSR-102”将它最终用作“Java标准扩展”。从2000年初就已经开始了JDOM开发。 JDOM与DOM主要有两方面不同。首先，JDOM仅使用具体类而不使用接口。这在某些方面简化了API，但是也限制了灵活性。第二，API大量使用了Collections类，简化了那些已经熟悉这些类的Java开发者的使用。

java操作word(内部资料)

JAVA操作word Java操作Microsoft Word之jacob(1) 现在我们一起来看看，用J1ava如何操作Microsoft Word。 jacob，官网是https://www.wendangku.net/doc/d110309141.html,/jacob 这是一个开源的工具。最新版本1.7 官方的解释是：The JACOB Project: A JAva-COM Bridge 这是官方对下载文件的说明： jacob.jar: a JAR file for the java classes which you must add to your CLASSPATH. The package names replace com.ms with com.jacob (for example https://www.wendangku.net/doc/d110309141.html,.Variant maps to https://www.wendangku.net/doc/d110309141.html,.Variant. jacob.dll: a small Win32 DLL which you must add to your PATH. samples: provided in Java source and compiled form to demonstrate various features of the product. In particular, a set of wrapper classes for Microsoft? ADO are provided as samples. 开发环境： JDK 1.6 MyEclipse Enterprise Workbench Version: 7.0 Milestone-1 Tomcat 5.5.27 现在MyEclipse中新建一个项目jacob，将jacob的jar包放到该项目的类库中。我的jacob版本是1.14.3 。

org.w3c.dom(java dom)解析XML文档

位于org.w3c.dom操作XML会比较简单，就是将XML看做是一颗树，DOM就是对这颗树的一个数据结构的描述，但对大型XML文件效果可能会不理想首先来了解点Java DOM 的API: 1.解析器工厂类：DocumentBuilderFactory 创建的方法：DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); 2.解析器：DocumentBuilder 创建方法：通过解析器工厂类来获得DocumentBuilder db = dbf.newDocumentBuilder(); 3.文档树模型Document 创建方法：a.通过xml文档 Document doc = db.parse("bean.xml"); b.将需要解析的xml文档转化为输入流InputStream is = new FileInputStream("bean.xml"); Document doc = db.parse(is); Document对象代表了一个XML文档的模型树，所有的其他Node都以一定的顺序包含在Document对象之内，排列成一个树状结构，以后对XML文档的所有操作都与解析器无关，直接在这个Document对象上进行操作即可；包含的方法：

4.节点列表类NodeList NodeList代表了一个包含一个或者多个Node的列表，根据操作可以将其简化的看做为数组 5.节点类Node

Node对象是DOM中最基本的对象，代表了文档树中的抽象节点。但在实际使用中很少会直接使用Node对象，而是使用Node对象的子对象Element,Attr,Text等 6.元素类Element 是Node类最主要的子对象，在元素中可以包含属性，因而Element中有存取其属性的方法

JAVA读取WORD文档解决方案

Java读取word文档解决方案 java读取word文档时，虽然网上介绍了很多插件poi、java2Word、jacob、itext等等，poi无法读取格式(新的API估计行好像还在处于研发阶段，不太稳定，做项目不太敢用)；java2Word、jacob容易报错找不到注册，比较诡异，我曾经在不同的机器上试过，操作方法完全一致，有的机器不报错，有的报错，去他们论坛找高人解决也说不出原因，项目部署用它有点玄；itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。经过一番选择还是折中点采用rtf最好，毕竟rtf是开源格式，不需要借助任何插件，只需基本IO操作外加编码转换即可。rtf格式文件表面看来和doc没啥区别，都可以用word打开，各种格式都可以设定。 -----实现的功能：读取rtf模板内容（格式和文本内容），替换变化部分，形成新的rtf文档。 -----实现思路：模板中固定部分手动输入，变化的部分用$info$表示，只需替换$info$即可。 1、采用字节的形式读取rtf模板内容 2、将可变的内容字符串转为rtf编码 3、替换原文中的可变部分，形成新的rtf文档主要程序如下：

以上为核心代码，剩余部分就是替换，从新组装java中的String.replace(oldstr,newstr);方法可以实现，在这就不贴了。源代码部分详见附件。运行源代码前提： c盘创建YQ目录，将附件中"模板.rtf"复制到YQ目录之下，运行OpreatorRTF.java文件即可，就会在YQ 目录下生成文件名如：21时15分19秒_cheney_记录.rtf的文件。。。。。文件名是在程序中指定的呵呵。由于是由商业软件中拆分出的demo所以只是将自己原来的写的程序分离，合并在一个java文件中，所以有的方法在示例程序中看似多余，没有必要那么麻烦。对于替换部分需要循环的特例程序，我不好拆分，里面很容易暴露商业软件的东西，所以就不贴了，有需要的话可以加我QQ或者MSN，一起讨论呵呵。附件传了半天也没有传上去，没有办法只有这样搞了呵呵。模板文件附件无法存放，需要的直接联系呵呵。其实直接看以下的java程序部分，就会明白

java读写xml文件的方法

在java环境下读取xml文件的方法主要有4种：DOM、SAX、JDOM、JAXB 1. DOM(Document Object Model) 此方法主要由W3C提供，它将xml文件全部读入内存中，然后将各个元素组成一棵数据树，以便快速的访问各个节点。因此非常消耗系统性能，对比较大的文档不适宜采用DOM方法来解析。 DOM API 直接沿袭了 XML 规范。每个结点都可以扩展的基于 Node 的接口，就多态性的观点来讲，它是优秀的，但是在Java 语言中的应用不方便，并且可读性不强。实例： Java代码 1.import javax.xml.parsers.*; 2.//XML解析器接口 3.import org.w3c.dom.*; 4.//XML的DOM实现 5.import org.apache.crimson.tree.XmlDocument; 6.//写XML文件要用到 7.DocumentBuilderFactory factory = DocumentBuilderFactory.newInst ance(); 8. //允许名字空间 9. factory.setNamespaceAware(true); 10. //允许验证 11. factory.setValidating(true); 12. //获得DocumentBuilder的一个实例 13.try { 14. DocumentBuilder builder = factory.newDocumentBuilder(); 15.} catch (ParserConfigurationException pce) { 16.System.err.println(pce); 17.// 出异常时输出异常信息，然后退出，下同 18.System.exit(1); 19.} 20.//解析文档，并获得一个Document实例。 21.try { 22.Document doc = builder.parse(fileURI); 23.} catch (DOMException dom) { 24.System.err.println(dom.getMessage()); 25.System.exit(1); 26.} catch (IOException ioe) { 27.System.err.println(ioe); 28.System.exit(1); 29.}

使用DOM4j解析xml文件

Xml文件： studentname 78 78 98 studentname 77 68 88 JAVA文件： import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.util.Iterator; import java.util.List; import org.dom4j.Attribute; import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.DocumentHelper; import org.dom4j.Element; import org.dom4j.io.OutputFormat; import org.dom4j.io.SAXReader; import org.dom4j.io.XMLWriter; /** *DOM4j对xml文件的操作 *操作DOM4j的时候注意要导入3个jar包，否则会报异常 *dom4j-1.6.1.jar *jaxen-1.1-beta-6.jar *saxpath.jar **/ public class ReaderDom4j {

java深度处理word

JAVA操作word jacob(1) 现在我们一起来看看，用Java如何操Word。 jacob，官网是https://www.wendangku.net/doc/d110309141.html,/jacob 这是一个开源的工具。最新版本1.7 官方的解释是：The JACOB Project: A JAva-COM Bridge 开发环境： JDK 1.6 MyEclipse Enterprise Workbench Version: 7.0 Milestone-1 Tomcat 5.5.27 现在MyEclipse中新建一个项目jacob，将jacob的jar包放到该项目的类库中。我的jacob版本是1.14.3 。

下面这一步非常重要，就是拷贝jacob目录中jacob-1.14.3-x86.dll文件到系统环境变量目录中一般情况就放在当前jdk中bin目录下。

。这里有一个MSWordManager 类，是jacob官方发布的工具类，里面有大多数Java操作MS Office的工具。 package com.test; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.Statement; import java.util.ArrayList; import java.util.List; import com.jacob.activeX.ActiveXComponent; import https://www.wendangku.net/doc/d110309141.html,.Dispatch; import https://www.wendangku.net/doc/d110309141.html,.Variant; public class MSWordManager { // word文档

Java解析XML文件

Java解析XML文件 ========================================== xml文件＜?xml version="1.0" encoding="GB2312"?＞＜RESULT＞＜VALUE＞＜NO＞A1234＜/NO＞＜ADDR＞四川省XX县XX镇XX路X段XX号＜/ADDR＞＜/VALUE＞＜VALUE＞＜NO＞B1234＜/NO＞＜ADDR＞四川省XX市XX乡XX村XX组＜/ADDR＞＜/VALUE＞＜/RESULT＞ ========================================== 1）DOM（JAXP Crimson解析器） DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。DOM是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。分析该结构通常需要加载整个文档和构造层次结构，然后才能做任何工作。由于它是基于信息层次的，因而DOM被认为是基于树或基于对象的。DOM以及广义的基于树的处理具有几个优点。首先，由于树在内存中是持久的，因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任何时候在树中上下导航，而不是像SAX那样是一次性的处理。DOM使用起来也要简单得多。 import java.io.*; import java.util.*; import org.w3c.dom.*; import javax.xml.parsers.*; public class MyXMLReader{ public static void main(String arge[]){ long lasting =System.currentTimeMillis(); try{ File f=new File("data_10k.xml"); DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); DocumentBuilder builder=factory.newDocumentBuilder(); Document doc = builder.parse(f); NodeList nl = doc.getElementsByT agName("VALUE"); for (int i=0;i＜nl.getLength();i++){ System.out.print("车牌号码:" +

java dom解析xml

java dom解析xml 010000 00000CC3 20100629173405 1 000001 import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.NodeList; public class FileTest { /** * @param args */ public static void main(String[] args) { DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); try { DocumentBuilder db = dbf.newDocumentBuilder(); Document doc = db.parse("d:/test.xml"); //得到根节点 Element root = doc.getDocumentElement(); NodeList nl = root.getElementsByTagName("HLR"); Element e = (Element) nl.item(0); String hlrId=e.getAttribute("HlrId"); System.out.println(hlrId); }catch(Exception e){

java用poi实现对word读取和修改操作

java用poi实现对word读取和修改操作新增WordUtil类，将代码拷进去直接运行即可 package com.cjhxfund.ats.fm.instr; import java.io.FileOutputStream; import java.util.HashMap; import java.util.Iterator; import java.util.List; import java.util.Map; import java.util.Map.Entry; import java.util.Set; import org.apache.poi.POIXMLDocument; import https://www.wendangku.net/doc/d110309141.html,ermodel.XWPFDocument; import https://www.wendangku.net/doc/d110309141.html,ermodel.XWPFParagraph; import https://www.wendangku.net/doc/d110309141.html,ermodel.XWPFRun; import https://www.wendangku.net/doc/d110309141.html,ermodel.XWPFTable; import https://www.wendangku.net/doc/d110309141.html,ermodel.XWPFTableCell; import https://www.wendangku.net/doc/d110309141.html,ermodel.XWPFTableRow; public class WordUtil { public static void searchAndReplace(String srcPath, String destPath, Map map) { try { XWPFDocument document = new XWPFDocument(POIXMLDocument.openPackage(srcPath)); // 替换段落中的指定文字 Iterator itPara = document.getParagraphsIterator(); while (itPara.hasNext()) { XWPFParagraph paragraph = (XWPFParagraph) itPara.next(); //String s = paragraph.getParagraphText(); Set set = map.keySet(); Iterator iterator = set.iterator(); while (iterator.hasNext()) { String key = iterator.next(); List runs=paragraph.getRuns();

java解析XML详解

详解Java解析XML的四种方法 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object Model),DTD(Document Type Definition),SAX(Simple API for XML),XSD(Xml Schema Definition),XSLT(Extensible Stylesheet Language Transformations),具体可参阅w3c官方网站文档https://www.wendangku.net/doc/d110309141.html,获取更多信息。 XML在不同的语言里解析方式都是一样的,只不过实现的语法不同而已。基本的解析方式有两种,一种叫SAX，另一种叫DOM。SAX是基于事件流的解析,DOM是基于XML文档树结构的解析。假设我们XML的内容和结构如下: ddviplinux m 30 本文使用JAVA语言来实现DOM与SAX的XML文档生成与解析。首先定义一个操作XML文档的接口XmlDocument 它定义了XML文档的建立与解析的接口。 package com.alisoft.facepay.framework.bean; /** * * @author hongliang.dinghl * 定义XML文档建立与解析的接口 */ public interface XmlDocument { /** * 建立XML文档 * @param fileName 文件全路径名称 */ public void createXml(String fileName); /** * 解析XML文档 * @param fileName 文件全路径名称 */ public void parserXml(String fileName); } 1. DOM生成和解析XML文档为 XML 文档的已解析版本定义了一组接口。解析器读入整个文档，然后构建一个驻留内存的树结构，然后代码就可以使用 DOM 接口来操作这个树结构。优点：整个文档树在内存中，便于操作；支持删除、修改、重新排列等多种功能；缺点：将整个文档调入内存（包括无用的节点），浪费时间和空间；使用场合：一旦解析了文档还需多次访问这些数据；硬件资源充足（内存、CPU）。 import java.io.FileInputStream; import java.io.FileNotFoundException;

Java操作word文档

Java操作Word文档操作微软word办公软件的开发工具： 1.Apache基金会提供的POI 2.通过freemarker去解析xml 3.Java2word 4.iText 5.Jacob 通过对以上工具的对比，本人发现还是Itext比较简单易用，很容易上手，能够很轻松的处理word的样式、表格等。贴上代码，供大家参考： Jar包准备： itext-2.0.1.jar -------------------核心包 iTextAsian.jar--------------------解决word样式、编码问题扩展包 1、设置标题样式 public static Paragraph setParagraphTitle(String content,Font contentFont){ Paragraph p = new Paragraph(content, contentFont); p.setAlignment(Table.ALIGN_CENTER); p.setIndentationLeft(60); p.setIndentationRight(60); p.setSpacingBefore(20); return p; } 2、设置内容样式：

public static Paragraph setParagraphStyle(String content,Font contentFont){ Paragraph p = new Paragraph(content, contentFont); p.setFirstLineIndent(40);// 首行缩进 p.setAlignment(Paragraph.ALIGN_JUSTIFIED);// 对齐方式 p.setLeading(30);// 行间距 p.setIndentationLeft(60);// 左边距,右边距 p.setIndentationRight(60); return p; } 3、设置文档末尾时间： public static Paragraph setParagraphTime(Font contentFont){ Paragraph p = new Paragraph(FormatUtil.getCurrentDate(), contentFont); p.setIndentationLeft(250); p.setIndentationRight(60); p.setLeading(30); p.setFirstLineIndent(40); return p; } 4、开始写word文档咯： public static void WriteDoc(String path,Map map){ Document document = null; try { File file = new File(path); if (!file.exists()) { file.createNewFile(); } document = new Document(PageSize.A4); RtfWriter2.getInstance(document, new FileOutputStream(file)); document.open(); // 设置title body 中文字体及样式 BaseFont cnFont = BaseFont.createFont("STSongStd-Light","UniGB-UCS2-H", BaseFont.NOT_EMBEDDED); Font titleFont = new Font(cnFont,22, Font.NORMAL, new

java 解析xml 并导入数据库(dom4j )

java 解析xml 并导入数据库（dom4j ) import java.io.File; import java.sql.Connection; import java.sql.PreparedStatement; import java.sql.ResultSet; import java.util.Iterator; import java.util.List; import org.dom4j.Document; import org.dom4j.Element; import org.dom4j.io.SAXReader; public class TestXMLImport { /** * @param args */ public static void main(String[] args) { String sql = "insert into T_XML(NUMERO, REPOSICION, NOMBRE, TURNOS) values (?, ?, ?, ?)"; Connection conn = null; PreparedStatement pstmt = null; try {

conn = DbUtil.getConnection(); pstmt = conn.prepareStatement(sql); Document doc = new SAXReader().read(new File("D:/share/JavaProjects/drp/test_xmlImport/xml/test01.XML ")); List itemList = doc.selectNodes("/ACCESOS/item/SOCIO"); for (Iterator iter=itemList.iterator(); iter.hasNext();) { Element el = (Element)iter.next(); String numero = el.elementText("NUMERO"); String reposicion = el.elementText("REPOSICION"); String nombre = el.elementText("NOMBRE"); List turnosList = el.elements("TURNOS"); StringBuffer sbString = new StringBuffer(); for (Iterator iter1=turnosList.iterator(); iter1.hasNext();) { Element turnosElt = (Element)iter1.next(); String lu = turnosElt.elementText("LU"); String ma = turnosElt.elementText("MA"); String mi = turnosElt.elementText("MI"); String ju = turnosElt.elementText("JU"); String vi = turnosElt.elementText("VI"); String sa = turnosElt.elementText("SA");