发布时间:2021-01-14 09: 56: 49
PDF文档作为一种以图像模型作为基础的文件格式,可以在不同操作系统的计算机上使用,而且由于其图像模型的特点,在打印时能保持颜色、排版等准确性,是一种十分流行的文件格式。
但PDF文档有一个缺点,就是其编辑功能不如Word文档等办公软件好用。因此,很多人在编辑PDF文档时会选择将其转换为Word文档等。本文将会教大家怎么正确使用文字识别软件ABBYY FineReader PDF 15进行PDF文档的格式转换。
一、使用转换文档功能
ABBYY FineReader PDF 15提供了多种PDF文档转换格式的选项。如图1所示,我们可以将PDF文档转换为Word文档、Excel电子表格,或其他如PPT演示文稿、TXT等格式。
接下来,我们以转换为Word文档为例,单击“转换为Microsoft Word”。
二、以转换为Word文档为例
在转换为Microsoft Word面板中,可通过使用其工具栏中的“添加文件”按钮,添加一个或多个PDF文档。
完成PDF文档的添加后,我们就需要选择转换保留的格式。那么,不同保留格式导出的Word文档有什么不同?该如何正确选择这些格式呢?
如图3所示,可以看到,精确副本与可编辑副本相似,均保持了大部分原始格式,但精确副本相对准确度更高,但提供的编辑选项有限,比如一些图形化文本可能无法编辑等。而格式化文本与纯文本更着重保留文本信息,精简了图片等元素。
小技巧:如果您不想花费时间逐一查看这些保留格式导出的文本样式,可使用“在OCR编辑中打开”的功能。
在OCR编辑器的顶部保存选项中,当我们选取不同的保留格式后,下方的预览窗口就会显示该保留格式相对应的保存样式。比如,当前选择的是“精确副本”,下方的预览窗口就会出现精确副本的导出样式预览。
接下来,我们通过导出的实例来进一步了解这些保留格式的区别。
1、精确副本与可编辑格式
在本例中,精确副本与可编辑格式的导出样式基本一致。这两种格式都能很好地“复制”原有PDF文档的排版、文本格式等,适合用于需要将整页整体输出使用的情况。
2、格式化文本
格式化文本,是在保留文本格式的前提下,将文本单列为一列,方便进行文本信息的提取使用。由于该格式保留了一部分文本格式,可直接用于PPT等演示文稿的制作,而无须进行文本的格式化。
3、纯文本
纯文本是四种保留格式中更为精简的格式,不仅精简了整体的格式,而且还精简了文本格式,适用于单纯的文本提取。
四、小结
以上四种保留格式是针对转换为Microsoft Word文档的,对于不同的转换格式,ABBYY FineReader PDF 15会提供不同的保留格式选项。我们可以根据文档的使用目的,选取合适的保留格式。
作者:泽洋
展开阅读全文
︾
读者也喜欢这些内容:
PDF如何转换Word文档 PDF转word格式乱了怎么调整
对于一些经常需要处理文档的工作者来说,文档的格式转换是十分常见的。然而我们在将PDF文件转换成Word文档时会出现格式乱了的情况,那么我们接下来就来说一说PDF如何转换Word文档,PDF转Word格式乱了怎么调整。...
阅读全文 >
几款常用的OCR文字识别软件
图片文字提取软件是什么呢?随着大家的办公需求的加大,现在已经有很多的办公软件出现了,那么,图片文字提取软件便是其中的一种,因为现在制作图片的要求也比较高,所以,在图片上加入文字也是很正常的事情,那么,怎么样才能够直接将图片中的文字提取出来呢?...
阅读全文 >
OCR图片文字识别是什么意思 OCR图片文字识别软件排行榜
随着科技的发展,OCR图片文字识别被广泛运用于办公中,但也有一些小伙伴对OCR图片识别不了解。今天小编就为大家介绍一下OCR图片文字识别是什么意思,OCR图片文字识别软件排行榜,感兴趣的话请继续看下去吧。...
阅读全文 >
PDF转换为什么乱码 PDF转换后是乱码怎么办
很多时候,我们将PDF转换后,发现文档中竟出现了大量乱码,使得原本简单的工作变得复杂。那么PDF转换为什么乱码,PDF转换后是乱码怎么办?今天小编就给大家介绍一下如何处理这些问题。...
阅读全文 >