Java 读取PDF中的表格

2025-10-31 13:35:25

1、将jar包下载到本地,解压。然后执行如下步骤来手动导入:

Java 读取PDF中的表格

2、找到本地路径下的jar文件,点击OK,添加到列表,

Java 读取PDF中的表格

3、添加后,勾选选项,点击Apply完成jar导入。

Java 读取PDF中的表格

1、import com.spire.pdf.*;


import com.spire.pdf.utilities.PdfTable;
import com.spire.pdf.utilities.PdfTableExtractor;


import java.io.FileWriter;
import java.io.IOException;


public class ExtractTable {
   public static void main(String[] args)throws IOException {
       //加载PDF文档
       PdfDocument pdf = new PdfDocument();
       pdf.loadFromFile("test.pdf");


       //创建StringBuilder类的实例
       StringBuilder builder = new StringBuilder();


       //抽取表格
       PdfTableExtractor extractor = new PdfTableExtractor(pdf);
       PdfTable[] tableLists ;
       for (int page = 0; page < pdf.getPages().getCount(); page++)
       {
           tableLists = extractor.extractTable(page);
           if (tableLists != null && tableLists.length > 0)
           {
               for (PdfTable table : tableLists)
               {
                   int row = table.getRowCount();
                   int column = table.getColumnCount();
                   for (int i = 0; i < row; i++)
                   {
                       for (int j = 0; j < column; j++)
                       {
                           String text = table.getText(i, j);
                           builder.append(text+" ");
                       }
                       builder.append("\r\n");
                   }
               }
           }
       }


       //将提取的表格内容写入txt文档
       FileWriter fileWriter = new FileWriter("ExtractedTable.txt");
       fileWriter.write(builder.toString());
       fileWriter.flush();
       fileWriter.close();
   }
}

2、执行代码,生成txt文档。如图表格读取结果:

Java 读取PDF中的表格

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢