发布时间:2021-02-23 13: 56: 08
PDF文档包含了图像型PDF(比如由扫描生成的文件,包含图像层)与文本型PDF(比如由word生成的文件)的文档类型,其区别在于是否可作文本的搜索。随着技术的发展以及人们需求的提升,很多人都需要从图像型PDF中获取文本信息,在这种情况下,双层PDF就应运而生了。
双层PDF实际上是在图像型PDF基础上,建立一个文本识别层,该文本层包含了可搜索的文本信息,我们可复制、搜索其中的文本。ABBYY FineReader PDF 15提供了制作双层PDF的功能,那么,该怎么使用呢?
一、使用OCR编辑器功能
双层PDF的制作,实际上就是进行图像智能文本识别的过程。因此,我们需要使用到ABBYY FineReader PDF 15的OCR智能文本识别技术。
如图2所示,在ABBYY FineReader PDF 15的创建任务页面使用“在OCR编辑器中打开”的功能,即可使用其“PDF文档和图像的高级转换功能”。
二、识别图像中的文本
使用OCR编辑器打开目标图像型PDF文件后,ABBYY FineReader PDF 15会自动开启OCR文本识别,该过程会花费一些时间。
待软件完成图像的文本识别后,如图4所示,就可以在软件右侧的文本识别区域获取到识别后的文本。
我们需要检查一下文本是否有识别错误。一般情况下,ABBYY FineReader PDF 15能达到很高的文本识别准确度,只有个别特殊符号可能会无法识别,但为了确保文档的严谨性,我们最好还是检查一下。
三、另存为可搜索PDF文档
确认文本识别无误后,如图5所示,打开文件菜单中的另存为选项,并选择其中的另存为“可搜索PDF文档”,即可创建双层PDF文档。
完成双层PDF文档的制作,如图6所示,打开PDF文档,可以看到,文本已经变为可选的状态,我们可对这些文本进行复制、搜索等。
四、小结
ABBYY FineReader PDF 15的智能OCR文本识别功能,可快速地将图像型的PDF文档转换为带有文本层的可搜索PDF文档,实现文档的更有效利用,避免了人工抄写的繁琐,是一个很实用的功能。
作者:泽洋
展开阅读全文
︾
读者也喜欢这些内容:
pdf单层和双层的区别 pdf单层怎么转双层
很多文档会保存为pdf格式,以保证准确性。但是由于文档版本的更新,内容可能也会做出相应的调整,那么此时就需要编辑文档了。有没有办法既保存源文档又可以编辑呢?那就是双层pdf了。pdf单层和双层的区别是什么?pdf单层又怎么转双层呢?...
阅读全文 >
jpg转pdf怎么转换 jpg转pdf免费软件推荐
有时人们需要将指定的jpg格式图片转换成pdf文档,如果对照jpg手动制作pdf文档不仅耗费精力而且效率不高,另一简单高效的方法就是借助pdf转换工具实现文档一键转换,那么今天我就为大家介绍一下jpg转pdf怎么转换,jpg转pdf免费软件推荐,感兴趣的话请继续看下去吧。...
阅读全文 >
电脑qq识别文字功能怎么用 电脑为什么qq识别文字失败
电脑QQ作为一款十分受欢迎的社交软件,深受用户的喜爱,许多人都在使用它聊天、刷空间、玩游戏,除此之外它里面还内置了许多有用且强大的功能如文字识别、扫一扫、QQ邮箱等等,小编就重点为大家来讲讲QQ文字识别功能,即电脑qq识别文字功能怎么用,电脑为什么qq识别文字失败。...
阅读全文 >
如何在文字识别软件ABBYY中创建区域模板,处理大量相同内容?
在处理一些纸质表格文件时,我们可能需要对这些文件进行扫描识别。如果这些文件都是比较相似的话,那么,ABBYY FineReader PDF 15 区域模板功能就能帮上大忙了。...
阅读全文 >