发布时间:2021-06-25 15: 54: 57
当我们使用ABBYY FineReader PDF 15(Win系统)的PDF编辑器打开PDF文档时,ABBYY的背景识别功能将自动开启。我们可以直接搜索和复制没有文本图层的文本和图片,例如扫描的文档和从图像文件创建的文档。
背景识别功能会把临时文本图层添加到文档,让我们可以标记、复制和搜索文档中的文本内容,我们还可以替换PDF文档中现有的文本图层,或者把永久文本图层添加到PDF文档中,让使其他阅读者也可以使用这些功能。
图1:ABBYY自动进行的背景识别
在顶部工具栏上直接使用识别文档功能。或者在菜单“文件>识别文档>识别文档...”中使用这项功能。
图2:识别文档
在打开的对话框中,指定适当的OCR语言。
图3:OCR识别语言
默认为“简体中文和英语”,我们可以根据文档内容选择具体语言,还可以在“更多语言”中选择其他语言。
图4:自定义选择其他语言
如果想要提高OCR识别的质量,我们可以启用图像预处理设置,不过使用图像处理可能会导致文档部分内容的排版出现改动。
拆分对开页:ABBYY会自动将包含对开页的图像拆分为两个彼此只包含一个页面的图像。
纠正页面方向:ABBYY会检测文本方向并在必要时更正。
使用建议值以获得更佳OCR:ABBYY应用需要的预处理设置。
点开“显示自定义设置”按钮后会出现更多可勾选选项。
图5:更多自定义设置选项
在确定预设设置后,我们输出的文件就会包含可搜索的文本图层。
将页面从一个文件添加到一个 PDF 文档时,或扫描纸质文档时,我们也可以添加文本图层,点击“添加页面 > 图像处理设置”进行设置,指定文档的语言。
图6:图像处理设置
如果我们想要检查已识别的文本,可以进行识别并在OCR编辑器中验证。以上便是ABBYY FineReader PDF 15里的OCR功能在PDF文件中的使用方法。大家如果想要了解更多关于ABBYY的OCR识别技巧,尽情关注ABBYY中文网哟。
作者:∅
展开阅读全文
︾
读者也喜欢这些内容:
为什么word转PDF图片模糊 word转pdf怎么保持图片清晰度
将Word文档转换为PDF格式可以提高文档的安全性、兼容性和可读性,同时方便打印、分享和浏览。但是在将Word文档转换为PDF格式之后,有时原先的图片会变得模糊,这是为什么呢?下面一起来了解为什么word转PDF图片模糊,word转pdf怎么保持图片清晰度的相关内容。...
阅读全文 >
OCR图片文字识别是什么意思 OCR图片文字识别软件排行榜
随着科技的发展,OCR图片文字识别被广泛运用于办公中,但也有一些小伙伴对OCR图片识别不了解。今天小编就为大家介绍一下OCR图片文字识别是什么意思,OCR图片文字识别软件排行榜,感兴趣的话请继续看下去吧。...
阅读全文 >
PDF转换为什么乱码 PDF转换后是乱码怎么办
很多时候,我们将PDF转换后,发现文档中竟出现了大量乱码,使得原本简单的工作变得复杂。那么PDF转换为什么乱码,PDF转换后是乱码怎么办?今天小编就给大家介绍一下如何处理这些问题。...
阅读全文 >
PDF文档转换成Word文档后如何编辑 PDF文档转换成Word文档后怎么清除回车号
PDF与Word都是办公上常见的文档,但有些小伙伴将PDF转换为Word后,发现编辑不了,这究竟是什么原因导致的呢,解决思路又是如何,看完下面的内容你就知道答案了。接下来咱们一起学习一下pdf文档转换成word文档后如何编辑,PDF文档转换成Word文档后怎么清除回车号,希望大家喜欢。...
阅读全文 >