发布时间:2015-11-26 09: 39: 40
由伦敦玛丽女王大学语言、语言学与电影学院、伦敦大学欧洲语言、文化与社会学院和伦敦利奥拜克学院组织的学术研究项目“论述1871-1918德意志民族主义和反犹太主义”正在进行着,该项目由利华休姆信托基金赞助,主要调查首次世界大战前数十年间,一些民族主义倾向和反犹太主义公众人物的意识形态和语言对德国宣传的影响,该分析旨在阐明德国民族主义作家使用的策略和修辞,维护他们在种族、文化和文明上的观点。为了将图像PDF文档转换为可编辑的文本格式,该项目团队选择了 ABBYY FineReader OCR图文识别软件。
挑战
首先,研究团队试图创建原文本综合档案,为深入分析提供一种平台。要实现这一点,文档需数字化并转换为可编辑和可搜索的文本,然而加大挑战的是,大部分文档都以“德文活字”书写,要么就是“黑体字”打字稿,尽管团队成员已经通过扫描打印文本生成仅图像的PDF版本文档,他们仍要将这些文档转换为可编辑的文本格式,以便进行数字化分析。
解决方案
充分考虑之后,团队选择ABBYY FineReader作为满足转换需求的合适解决方案。ABBYY FineReader是一流的FineReader光学字符识别(OCR)软件的特殊版本,用于识别古老字体,比如1800和1938年间的德文活字和黑字体文本,设计用来将旧文档、课本和纸质文件的扫描件转换为文本,实现数字化归档和出版,是处理德文活字的全字体OCR软件。
“手动重新输入文档会浪费不必要的时间和资源,在ABBYY FineReader的帮助下,我们可以更快更有效地开始分析文本,”负责创建和技术管理经验主义文本文库的项目助理研究员,Stefan Baumgarten博士解释道, “给我们带来的关键好处不仅仅是将课本和其他原始材料转换为可编辑文本的能力,还能将那些转换的结果以时下流行并且易读的字体类型保存,通过使用ABBYY FineReader转换文档,比起手动重新输入文档,我们已经能够处理更多倍的页面。”
结果
在ABBYY FineReader的帮助下,“论述1871-1918德意志民族主义和反犹太主义”团队能够获得学术界的主要好处,该项目带来了新来源的全面互联网档案,为后期进一步研究提供了重要基础,此外,该团队还通过在国内大学举办题为“英语与德语民族主义和反犹太主义言论(1871-1945)”的国际会议,促进了学者之间的跨学科交流,该会议发起了有关德语与英语民族主义和反犹太主义言论的更广泛的辩论。
更多关于ABBYY FineReader的案例,请参考ABBYY中文服务案例中心。
展开阅读全文
︾
读者也喜欢这些内容:
PDF转成图片的方法 PDF转图片不清晰怎么办
PDF文档和图片都是常用的文件格式,在工作中我们需要根据不同的需求来灵活地对文件的格式进行更改,这就需要我们掌握PDF转成图片的方法。PDF转图片不清晰怎么办?下文中会为大家进行详细地解答。...
阅读全文 >
几款常用的OCR文字识别软件
图片文字提取软件是什么呢?随着大家的办公需求的加大,现在已经有很多的办公软件出现了,那么,图片文字提取软件便是其中的一种,因为现在制作图片的要求也比较高,所以,在图片上加入文字也是很正常的事情,那么,怎么样才能够直接将图片中的文字提取出来呢?...
阅读全文 >
如何把JPG图片转换成Word文字 JPG图片转换成Word的软件有哪些
如今许多文字内容都是以图片格式展示出来的,因为图片看起来更美观更能够让人眼前一亮,但如果想要将图片中的内容转换为文字却并不简单,把文字一个一个的在键盘上敲起来,不仅浪费时间效率还低,那么应该怎么办呢?下面小编就来为大家讲讲如何把JPG图片转换成Word文字,JPG图片转换成Word的软件有哪些?...
阅读全文 >
PDF转换为什么乱码 PDF转换后是乱码怎么办
很多时候,我们将PDF转换后,发现文档中竟出现了大量乱码,使得原本简单的工作变得复杂。那么PDF转换为什么乱码,PDF转换后是乱码怎么办?今天小编就给大家介绍一下如何处理这些问题。...
阅读全文 >