如何让扫描仪文字识别更准确 (如何让扫描仪速度变快)

扫描仪的“身影”如今己是随处可见,但是普通用户只是用它来扫描一些照片,以便放到网上启动展现;殊不知扫描仪在录入文字资料方面也是一把“好手”,经过扫描仪来极速扫描、识别文字,曾经成为许多单位用户和团体用户每天必经的“功课”之一。不过在用扫描仪识别、录入文字资料的环节中,不少人往往只会用扫描仪缺省的设置参数来扫描识别文字,遗憾的是这种识别方法经常不可准确地将资料中的文字识别进去。为了有效提高办公效率,学会一些文字识别的操作技巧,从而提高文字资料的录入速度是十分有必要的。如今,笔者就将自己在扫描识别文字环节中总结进去的一些阅历奉献进去,与各位好友分享一下!从识别软件开掘 (本文为 电脑知识网介绍文章) 兴许有人说,识别软件不是内置在扫描仪驱动程序中,这有什么好开掘的?其实不然,不同的OCR扫描识别软件在文字识别的才干以及性能方面是不齐全相反的,而筛选一款操作繁难、识别才干较强的识别软件是提高文字识别准确率的前提。普通用户通常都会经常使用扫描仪内置的OEM识别软件,不过这种识别软件相比其他专业的识别软件来说,识别性能不强,文字识别的准确率也不是很高,甚至还不可对中文字体启动识别;而相似尚书OCR6.0、清华紫光OCR2003等专业的文字识别软件,岂但在文本智能识别方面有较强的才干,而且在经常使用性能方面也比拟突出一些,决定这些专业的识别软件可以很轻松地提高文字的识别准确率。www.ITcompUtER.cOM.Cn当然,要是指标文稿中蕴含的文字具备复杂的格局,比如说段落中产生了首行缩进格局,文字字体经常使用了斜体、粗体等格局,那么有的OCR软件在识别这些格局时,经常会识别出乱码来;所以当咱们在扫描识别一些具备不凡格局的文字资料时,必定要决定可以支持文字格局的扫描识别软件,只要这样才干取得较高的文字识别成功率。从搁置操作开掘不少人都以为搁置扫描原稿是一件十分繁难的事件,只需将原稿侧面的内容对着平板玻璃搁置,而后盖上扫描仪的下面盖就可以了;其实原稿的搁置操作也会影响文字的准确识别,正确搁置文稿的方法应该为先将文稿侧面的内容对着平板玻璃搁置,而后将文稿位置调整到扫描起始线正中,同时确保扫描仪的平板玻璃外表完整和洁净,最后放下扫描仪的下面盖。要是文稿搁置有必定歪斜角度的话,必定要在扫描实现后经常使用旋转工具对歪斜文字启动纠正,不然的话扫描识别程序会将水平笔划看作斜笔划来解决,这样文字识别的正确率就会降低很多。从识别参数开掘在经常使用OCR识别软件来识别指标文稿中的文字时,经常须要先在识别软件中启动适宜的参数设置,毕竟经常使用自动的参数设置是不可失掉最令人满意的成果的。普通来说,须要设置的识别参数关键包括扫描形式设置、分辨率设置、亮度对比度设置等;在识别纯文字资料时,往往只须要将识别软件的扫描形式设置为“黑色”形式就可以了,要是将扫描形式设置为“黑色”或“灰度”形式的话,只会参与扫描识别的期间,而且也不会提高文字识别的准确率。要是被识别的指标文稿品质比拟差时,咱们可以尝试将扫描形式设置为“灰度”形式,而后用关系的扫描软件对扫描结果启动一下解决再继续启动识别,这样一来文字识别准确率就会大大提高。在启动分辨率设置时,通常将分辨率设置得越低,扫描仪扫描文本的速度就越快,但扫描进去的文稿成果就越差;相反,将扫描分辨率设置得越高,扫描仪扫描文本的速度就越慢,但扫描进去的文稿成果就越好。不过这一实践并不是千篇一概的,毕竟将扫描分辨率设置得太高的话,文稿纸张上的小斑点都有或许被识别成标点符号,这样一来文字识别准确率反而会得不到提高。经过笔者屡次测试发现,假设指标文稿中的文字字号为1、2、3号的话,那咱们只须要将扫描分辨率设置为200dpi就可以了;要是指标文稿中的文字经常使用的是4号或5号字体的话,那可以将扫描分辨率设置为300dpi;高于5号的文字字体,必定将扫描分辨率设置为400dpi以上,但不能超越扫描仪的光学分辨率。经常使用适宜的扫描亮度与扫描对比度,可以确保指标文稿中的文字黑色明显,这对提高文字识别准确率十分关键;在调整扫描亮度与对比度时,咱们应该细心观察扫描预览成果,当发现预览成果中的文字笔画较细但并没有断开时,就标明此时的亮度和对比度数值是最适宜的。假设在识别环节中,发现预览成果中的文字线条较粗较黑而且笔画分不清时,就标明此时的亮度数值设置得小了,咱们应该尝试提高一些亮度值来看看;要是发现预览成果中的文字线条看下来凹凸不平,甚至有断线或完整不全的现象时,那就标明此时的扫描亮度调整得有点高了,咱们应尝试将亮度数值降低一些再看看。此外,“输入消息”的参数设置也会对文字的识别准确率带来必定的影响;在缺省形态下,“输入消息”的数值经常会被设置为100%,这种参数设置仅仅适宜那些新墨粉打印进去的文字资料或许印刷进去的报纸、书籍等,相反在扫描识别那些文字颜色比拟浅的文稿时,最好能够将“输入消息”的数值调整得稍微大一些,不然的话扫描进去的图象看下来很不明晰,而且文字识别的准确率也不会很高;当然“输入消息”的数值也不能设置得过大,不然会延伸扫描识别的期间,而且还会使识别进去的文字笔画看不分明。从识别原稿开掘在扫描识别不同类型的原稿时,须要用不同的识别解决方法,才干保障失掉比拟现实的识别成果。假设原稿为报纸或许半透明文稿的话,那么在扫描识别之前要是不采取任何措施的话,报纸反面的文字很容易透过纸张外表来混杂指标文字的字形,从而会对文字的正确识别形成不小的阻碍。为此在扫描识别这类文稿时,最好在原稿反面盖上一张黑纸,同时在扫描环节中,将对比度稍微提高一些,这样就能有效降低反面文字对识别成果的搅扰水平了。在扫描识别一些印刷品质较差的文稿时,必定要先启动颜色调理操作,以确保扫描结果看下来黑色明显,否则的话扫描图象中有或许会产生许多黑色斑点,从而重大影响文字识别的准确率。当然在对颜色参数启动调理时,必定留意观察扫描识别界面中的图象预览成果,并依据预览成果对颜色启动重复调整,才干失掉十分现实的识别结果。在扫描识别图文混排类型的原稿时,应该先确认一下自己决定的扫描识别运行程序能否支持智能图文剖析性能,要是可以支持的话,那咱们就应该启用该性能,这样扫描识别程序就会智能剖析出指标文稿中的文字内容、文本位置等,而文字内容局部只需依照标示顺序来启动反常识别就可以了。从手工识别开掘如今许多文稿排版为了谋求尽如人意的视觉成果,经常会经常使用图文混排形式,假设咱们将原稿繁难地扫描成一幅图像的话,将会重大影响文字的识别准确率。有鉴于此,咱们应该依据实践状况,对原稿版面启入手工划分,让其版面分为若干个区域;而且应该保障处于同一区域中的文字字号与字体最好相反,尽量没有图像、图形,每一行的文字宽度应该相反,要是发现宽度长短不一的话,最好再启动细分,通常状况下一次性最多能扫描识别10个决定区域。此外依据实践状况,咱们还须要对多个决定区域设置好识别顺序。大家千万不能嫌这样的操作比拟烦,这可是有效提高文字识别准确率的现实路径之一。 如何备份数据 如何设置双网卡 如何设置双网卡?在Windows NT中网卡可有如下几种状况:假设一台Windows NT Server用多块网卡同时衔接到多个网络中,咱们把这种计算机称为多宿主计算机,这样,每块网卡可以同时衔接到一个独自的网络,只需网络治理软件容许,该计算机就可同时访问任何一个网络中的资源。 每块网卡可以参与5个以上的IP地址,即单击“开局”→“设置”→“控制面板”→“网络”→“TCP/IP性能”可以最多输入5个IP地址。假设仅在一个系统中装置两块以上的网卡,以设成一个外部网段来提高网络效率,也是可行的,配件的装置关键留意终止及IRQ抵触,设置时要留意驳回不同的子网掩码及参与网关(设为两块网卡的IP地址),其他50台上班站再一分为二各自驳回相应的子网掩码。 (本文是电脑知识网 介绍文章)
© 版权声明
评论 抢沙发
加载中~
每日一言
不怕万人阻挡,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender