abbyychina官方网站 > FineReader使用技巧 > “征服”PDF的神兵利器—ABBYY FineReader 12试用手记

“征服”PDF的神兵利器—ABBYY FineReader 12试用手记

发布时间:2016-04-08 09: 15: 12

今天给大家分享一篇微博名为‘译言牵金’的用户使用ABBYY FineReader 12解决拷贝PDF内容后出现硬回车问题的心得,希望能帮助大家更多地了解这款产品。

我在一家投行研究部做笔译,工作中最常见的源语言文档类型是PDF。大家都知道,PDF的好处是小巧、方便发送和下载,另外,一般情况下无法再编辑。

PDF文档

恰恰是上述第二个特点给我们的翻译工作带来很大困难。在我的推动下,整个团队都用计算机辅助翻译软件Trados07版进行翻译,用过Trados的同行都知道:07版只能打开可编辑的文档,例如MS-Word的doc文档等。因此解决方案只有一个:把PDF转为可编辑文档。

知易行难。从2011年到最近,我们用过n种第三方软件来进行格式转换,效果都差强人意。包括solid converter、pdf editor以及Adobe自带的转换工具。在Trados推出11版Studio后,也试用过其中的PDF转换功能。但这些软件有一个共通的问题:转换成Word 后,许多文字段后会有不必要的硬回车(如下图)。

PDF转换

这些硬回车看似无伤大雅,但由于我们用Trados07版的tageditor 翻译Word文档(注:我们使用的是Win7系统,附带的Word 2007版对内嵌式Trados的兼容性较差),在Tageditor 界面中,这些硬回车非但难看,而且破坏阅读理解和翻译完整性(参见下图),图中的就是Word中的硬回车。对于比较熟悉Trados的人来说,这些(具体形状参见本段末尾)也无法通过设置断句规则来跳过。

Word硬回车

CF硬回车

无奈之下,只能“土法炼钢”:让团队成员手工拷贝PDF里的文字到Word,再编写简单的宏以比较快的速度消除硬回车。这个法子原始落后,而且费时,但却是仅有的有效的手段。其他基于软件的转换文档方法虽然快,但之后因为无法消除每行后多余硬回车,导致返工的时间常大大超过先前节省的时间,得不偿失。

虽然经过一段时间的“折磨”,大家已然习惯手动拷贝模式,但我始终认为:在工作量日渐增多而人员又未增加的情况下,人力做重复拷贝及删除硬回车的工作实乃莫大浪费。在苦思对策之际,在微博上看到ABBYY FineReader 12试用活动。头脑灯泡一亮:这也许是出路!

素闻ABBYY FineReader OCR识别领域的翘楚,这次请ABBYY FineReader来解决拷贝后硬回车问题虽有杀鸡用牛刀之嫌,但根据我的实际经验,一篇上百页的图文PDF(投行长报告的常态)人工拷贝也需要几个小时,“(实习)生可忍熟(练工)不可忍”!

FineReader

经过漫长的下载和审批流程后,我的电脑上终于安装了ABBYY FineReader 12简体中文试用版。我迫不及待地打开后,赶紧拽过一篇PDF就扫描起来,结果如下:

不难发现:原先的每行后多余硬回车大多数消失无踪。再拿Trados的Tageditor打开看看:

硬回车消失

在段落中讨厌累赘的符号一个也没有,看起来赏心悦目,心旷神怡!

总结:ABBYY FineReader 12能有效消除PDF转Word后的多余行后硬回车,显著提高文档编译效率。比坊间其他收费/免费软件的效果都要好。至于ABBYY FineReader 12其他逆天功能,网友之述备矣。总之,说ABBYY FineReader 12是搞定PDF的“神兵利器”,良有以也!

原文地址: http://weibo.com/p/1001603708331540753887。

更多关于ABBYY OCR技术的信息,可点击进入ABBYY中文合作伙伴网站 www.abbyychina.com 进行了解。

展开阅读全文

标签:ABBYY FineReaderABBYY FineReader 12OCR图文识别软件OCR文字识别软件

读者也访问过这里:
ABBYY FineReader
一款功能强大的OCR和PDF软件
立即购买
联系客服:
400-8765-888
kefu@makeding.com
热门文章
ABBYY FineReader 12激活教程
安装完 ABBYY FineReader 12 之后,需要激活程序才能在完整模式下运行。在受限模式下,将根据您的版本和所在地区禁用一些功能。
2023-03-23
ABBYY FineReader 12注册码-激活码-序列号地址
ABBYY FineReader 12 OCR图文识别软件自2014年4月发布以来,屡获殊荣,是图像和文件识别以及办公的好帮手,那么对于这样一款用途广泛的软件来说,如何获取注册码、激活码或序列号想必是大家最关心的问题。
2023-03-23
ABBYY PDF Transformer+注册码-激活码-序列号地址
提到PDF,相信很多人都会很自然地想到ABBYY PDF Transformer+,它是一个新的,全面巧妙地解决PDF文档的工具,可以编辑PDF文档,在PDF文档中添加评论,添加密码保护,实现简单环保地阅读PDF文档,能够便捷地处理任何类型的PDF文件,非常有效地提高日常工作效率。
2023-03-23
几款常用的OCR文字识别软件
图片文字提取软件是什么呢?随着大家的办公需求的加大,现在已经有很多的办公软件出现了,那么,图片文字提取软件便是其中的一种,因为现在制作图片的要求也比较高,所以,在图片上加入文字也是很正常的事情,那么,怎么样才能够直接将图片中的文字提取出来呢?
2023-06-07
使用序列号激活ABBYY FineReader 14
安装完 ABBYY FineReader 14 之后,很多小伙伴会有这样的疑问,安装完成后不知道如何激活软件,找不到输入序列号的入口,本文对这一问题进行讲解。
2020-04-07
破解版的OCR文字识别软件,带来了太多安全问题
很多小伙伴在下载OCR文字识别软件时,会习惯性去找破解版的软件。那么到底什么是破解版的软件呢?
2021-09-08
最新文章
JPG转PDF后提示文件损坏 JPG转PDF后如何保存
如果需要将JPG图像与其他文档或文件一起保存或共享,将其转换为PDF格式可以更方便地进行管理和传输。PDF格式可以更好地保护图像的质量和完整性,避免在传输或打印过程中出现失真或变形。在abbyy软件中将JPG文件转换为PDF格式后,提示文件损坏是为什么呢?下面一起来了解JPG转PDF后提示文件损坏,JPG转PDF后如何保存的相关内容。
2024-11-03
OCR识别应用有哪些 OCR识别对象的文件类型
OCR(光学字符识别)是针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。那OCR识别的应用有哪些呢?下面一起来了解ocr识别应用有哪些,ocr识别对象的文件类型的相关内容。
2024-11-03
pdf格式如何转换成word文档格式 pdf格式转换word格式图片不清楚
将PDF格式文件转化成Word文档格式文件有助于对文档内容进行修改和编辑。那怎么将PDF格式转换成Word文档格式呢?下面一起来了解pdf格式如何转换成word文档格式,pdf格式转换word格式图片不清楚的相关内容。
2024-06-27
pdf编辑器怎么删除页码 pdf编辑器怎么删除部分内容
PDF编辑器是一种用于编辑PDF文档的软件工具,用户可以在其中对PDF文档进行各种操作,比如修改、添加、删除文本和图像,以及调整页面布局、插入注释和标记等。页码是文档页面的编号,通常显示在每页的底部或顶部。
2024-06-03
图片文字怎么转换成pdf文档 图片转成的pdf如何转可编辑文字
将图片文字转换成PDF文档可以提供更好的文档保存、共享、编辑和安全控制等功能,方便在不同场景下使用和处理文档。将PDF文档转可编辑文字可以提供更大的灵活性和便利性,使你能够更轻松地处理和利用PDF中的文本内容。
2024-05-07
pdf变成jpg格式的软件有哪些 pdf变成jpg格式图片怎么弄
PDF是一种常见的文档格式,JPG是一种常见的图片格式。PDF文件转换成JPG格式可以帮助你更方便地处理和使用PDF文件中的图片内容。那有什么软件可以将PDF文件转换成JPG格式呢?下面一起来了解pdf变成jpg格式的软件有哪些,pdf变成jpg格式图片怎么弄的相关内容。
2024-05-07

微信公众号

欢迎加入ABBYY产品的大家庭,立即扫码关注,获取更多办公软件动态和资源福利。