红联Linux门户
Linux帮助

linux下如何将pdf转换成text文本

发布时间:2016-06-12 10:51:25来源:linux网站作者:cbh0623367368

PDF中的有些文字是无法复制的, 面对整篇的文字,让我们一个字一个字的输入需要耗费大量的时间与经历,如果需要几百页的文字,那就更不可能了.小弟在Linux中找到了几款转换工具,亲测效果相当不错,下面一一介绍.


安装软件

sudo apt-get install gocr

sudo apt-get install tesseract-ocr


打开Screenshot截屏软件截取你要转换的文字

linux下如何将pdf转换成text文本

linux下如何将pdf转换成text文本

打开libreOffice Writer,将刚才截屏的图片托进去.

linux下如何将pdf转换成text文本

点击保存为PDF格式文件,文件名为text

linux下如何将pdf转换成text文本

找到保存好的text.pdf文件,右键打开终端.

linux下如何将pdf转换成text文本

在终端中输入pdftoppm text.pdf  a,得到a-1.ppm文件

linux下如何将pdf转换成text文本

然后输入命令:tesseract a-1.ppm a,得到a.txt文件.

linux下如何将pdf转换成text文本


本文永久更新地址:http://www.linuxdiyf.com/linux/21451.html