Java 读取/获取PPT文本
1、步骤1:在Java程序中新建一个文件夹可命名为Lib。并将产以下路径中的jar文件复制到新建的文件夹下。
2、步骤2:复制文件后,添加到引用类库:选中这个jar文件,点击鼠标右键,选择“Build Path” – “Add to Build Path”。完成引用。
1、测试文档如下:
2、import com.spire.presentation.*;
import java.io.FileWriter;
public class ExtractText {
public static void main(String[] args) throws Exception {
//创建Presentation实例
Presentation ppt = new Presentation();
//加载PowerPoint文档
ppt.loadFromFile("test.pptx");
StringBuilder buffer = new StringBuilder();
//遍历文档中的幻灯片,提取文本
for (Object slide : ppt.getSlides()) {
for (Object shape : ((ISlide) slide).getShapes()) {
if (shape instanceof IAutoShape) {
for (Object tp : ((IAutoShape) shape).getTextFrame().getParagraphs()) {
buffer.append(((ParagraphEx) tp).getText());
}
}
}
}
//保存文本到文本文件
FileWriter writer = new FileWriter("ExtractText.txt");
writer.write(buffer.toString());
writer.flush();
writer.close();
}
}
3、运行程序,生成文档,文档读取效果如下所示: