光学字符识别

✍ dations ◷ 2025-10-24 02:06:20 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 红色毛癣菌红色毛癣菌(学名:Trichophyton rubrum)是毛癣菌属下的一个种,是人源的皮癣菌,引起常见的皮肤浅部真菌病,如手癣、足癣、头癣等。红色毛癣菌是引致东南亚地区及澳洲北部的原住民体
  • 至尊公主号至尊公主号(英语:Grand Princess)是一艘隶属公主邮轮集团的至尊级(英语:Grand-class cruise ship)游轮,该邮轮始建于1998年,由芬坎蒂尼集团在意大利蒙法尔科内建造,建造成本约为4.5亿
  • 语言的起源语言的起源是一个有高度争议性的话题,由于可得到的实证证据的欠缺,许多人认为严肃的学者不应涉足于此问题。1866年,巴黎语言学会(法语:Société de linguistique de Paris)甚至明
  • 信息时代信息时代通常也是指计算机时代或者数字时代。它是指在现时代,个人都有能力去自由传递信息,以及适时获取信息的这种特征,这在过去是很难或者不可能做到的。它和数字时代以及数字
  • 不宁腿症候群不宁腿綜合症(英语:Restless legs syndrome, RLS),又称睡眠腿动症、不安腿综合征、腿不宁綜合症、Willis-Ekbom病或Wittmaack-Ekbom綜合症是一种强烈想要让腿部移动的障碍。平常
  • 质量投射器质量投射器,亦称质量加速器(Mass Driver),是一种利用电磁加速工具,基本原理是利用反复改变的电磁场来让磁化了的物体加速并投射出去。原理和磁浮列车以及磁道炮(电磁炮)相类似。质
  • Resub2/subSsub7/sub七硫化二铼是一种无机化合物,化学式为Re2S7。它可由ReO4-与H2S在4 mol/L的HCl中反应制得。
  • 福菜福菜或称为覆菜,是加盐腌渍过的酸菜,经由阴干日晒的加工,在水分尚未完全干燥时,塞入玻璃瓶(台湾农家常使用台湾烟酒公司的米酒玻璃瓶),或装入大型菜瓮中。密封后等待酸菜自然发酵,约
  • 热带气候热带气候(英语:Tropical climate)或称低纬度气候 ,在柯本气候分类法中,是属于非干燥气候的“A”型气候,地处于赤道南北两侧跨20-40个纬度以内,与中、高纬度气候不同的是,热带气候的日
  • 李白李白(701年5月19日-762年11月30日),字太白,号青莲居士,中国唐朝诗人,自言祖籍陇西成纪(今甘肃省天水市秦安县),先世西凉武昭王李暠之后,与李唐皇室同宗。幼时内迁,寄籍剑南道绵州(今四川