Java 读取Word目录内容

2025-11-04 03:29:41

1、将Word库下载到本地,并解压,找到lib文件夹下的jar文件。然后在IDEA程序中打开“Project Structure”,执行如图步骤:

Java 读取Word目录内容

2、找到本地路径下的jar文件,点击“OK”,添加到列表:

Java 读取Word目录内容

3、勾选选项,点击“Apply”,然后等待程序安装导入jar:

Java 读取Word目录内容

4、完成jar导入后,编辑如下Java代码:

import com.spire.doc.Document;

 

import com.spire.doc.Section;

 

import com.spire.doc.documents.Paragraph;

 

import java.io.BufferedWriter;

 

import java.io.File;

 

import java.io.FileWriter;

 

import java.io.IOException;

 

public class GetTOC {

 

   public static void main(String[] args) throws IOException {

 

       //加载包含目录的Word文档

 

       Document doc = new Document();

 

       doc.loadFromFile("目录2.docx");

 

       //获取第一节

 

       Section section = doc.getSections().get(0);

 

       //保存目录内容到.txt文档

 

       File file = new File("GetToc.txt");

 

       if (file.exists())

 

       {

 

           file.delete();

 

       }

 

       file.createNewFile();

 

       FileWriter fw = new FileWriter(file, true);

 

       BufferedWriter bw = new BufferedWriter(fw);

 

       //遍历第一节中的所有段落

 

       for (int i = 0; i < section.getParagraphs().getCount(); i++)

 

       {

 

           Paragraph paragraph = section.getParagraphs().get(i);

 

           //判断段落是否为目录

 

           if (paragraph.getStyleName().matches("TOC\\w+"))

 

           {

 

               //获取目录中的文本内容

 

               String text = paragraph.getText();

 

               //写入txt文档

 

               bw.write( text+"\r");

 

           }

 

           bw.write("\n");

 

       }

 

       bw.flush();

 

       bw.close();

 

       fw.close();

 

   }

 

}

5、执行代码,读取目录,生成txt文档,如图效果:

Java 读取Word目录内容

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢