如何利用百度识图来将PDF图片转成TXT文本
1、打开https://cloud.baidu.com/product/ocr/general
这个页面中间有一个功能演示的可以识别PNG,JPG,BMP等文件格式
所以需要将PDF 转换成图片格式然后再来这里识别转换
好啦,先看我准备的PDF扫描件
写作题库185真题 素材支持细节(全英文,仿写朗诵版).pdf


2、提取PDF 扫描件的图片
下载 汉王PDF OCR单文件优化 V8.1.3免安装中文版
http://www.xdowns.com/app/304155.html

3、下载以后 打开
文件->打开图像->选择PDF,然后会自动识别成图片

4、识别—》选择全部文件->

5、然后 选择 输出->到指定格式文件—》选择HTML
记得把OUTPUT 文件路径改到自己知道的路径下哈


6、这个 3.files 就是图片
然后利用百度OCR 去识别图片就可以啦
https://cloud.baidu.com/product/ocr/general
选择上传的图片,左边是原始图片,右边是识别出来的文字

7、将右边的文字复制,然后粘贴到txt文件中就可以啦。
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:187
阅读量:134
阅读量:32
阅读量:127
阅读量:124