光学字符识别

✍ dations ◷ 2025-04-25 01:10:46 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 麻疹病毒属麻疹病毒属(学名:Morbillivirus)是单股反链病毒目(Mononegavirales)副黏液病毒科 (Paramyxoviridae)副黏液病毒亚科的一个属。本属的病毒均为传染度极高的品种,而且到现在还有新品种
  • 麦可·法拉第迈克尔·法拉第(英语:Michael Faraday,1791年9月22日-1867年8月25日),英国物理学家,在电磁学及电化学领域做出许多重要贡献,其中主要的贡献为电磁感应、抗磁性、电解。虽然法拉第没
  • 雅各雅各(Jacob或Ya'akov;希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Aram Tsov
  • 墨尔森梅尔森(荷兰语:Meerssen)是荷兰的一座城市和市镇,位于荷兰东南部,在行政区划上属于林堡省。《梅尔森条约》于870年在这里签署。
  • 发炎反应炎症反应、炎性反应,俗称炎症,是指具有血管系统的活体组织对致炎因子及局部损伤所发生的防御性为主的反应,中心环节是血管反应,是生物组织受到外伤、出血或病原感染等刺激,激发的
  • 《诗经》是中国最早的诗歌总集,收录自西周初年至春秋中叶(约前11世纪-前6世纪)的诗歌305篇(除此之外还有6篇有题目无内容,即有目无辞,称为笙诗六篇,题目分别是南陔、白华、华黍、由
  • 鹅颈瓶鹅颈瓶是一种由特殊形状的管道引向烧瓶的实验设备。“鹅颈”会降低空气在管中流动的速度,空气中的粒子,比如细菌,会困在其潮湿的内表面上。将瓶中液体煮沸,杀死瓶中微生物后,只要
  • 细菌学家细菌学(英语:bacteriology),一个以研究细菌为主的学科,是微生物学的分支。主要的工作是辨认细菌、培养细菌、分类细菌种属、找出细菌种属的特征。它跟微生物学,有时候会被人当成同
  • 长江中下游平原长江中下游平原是一个位于中国中、东部的平原,从巫山山脉向东开展,由长江及其支流冲积而成,面积约20万平方公里,海拔在50米以下。其面积在中国三大平原中居第三位,位列东北平原(面
  • 联邦警卫局联邦警卫局(俄语:Федеральная служба охраны,俄语缩写:ФСО,拉丁语转写缩写:FSO)是俄罗斯联邦负责保护总统和其他高级别官员的机构,它继承自苏联时代的克