OCR

✍ dations ◷ 2024-07-05 09:49:22 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 假牙假牙或称义齿是一种替代牙齿的辅助装置。一般用于代替由于意外事故、天生缺失或牙齿老化脱落等而无法正常使用的牙齿。假牙的制作到十八世纪都没有大进步,主要是材质方面没有
  • 医学研究人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学医学是以诊断、治疗和预防生理和心理
  • 埃涅阿斯记《埃涅阿斯记》(拉丁语:Aeneis .mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium",
  • 染料染料是有颜色的物质但有颜色的物质并不一定是染料。作为染整工业基础,必须能够使一定颜色附着在纤维上。且不易脱落、变色。染料通常溶于水中,一部分的染料需要媒染剂使染料能
  • 4d1 5s22, 8, 18, 9, 2蒸气压第一:600 kJ·mol−1 第二:1180 kJ·mol−1 第三:1980 kJ·mol主条目:钇的同位素钇(英语:Yttrium)是化学元素,符号为Y,原子序为39,是银白色过渡金属,化
  • 榛果俪榛果俪(意大利语:Frangelico)是一款意大利皮埃蒙特大区库内奥省Canale市出产的榛子香草风味力娇酒,酒精浓度20%。20世纪80年代最初发布的时候,榛果俪的酒精浓度为24%。榛果俪的酒
  • 中继透镜中继透镜(relay lens)通常有两组镜片,安装在镜筒中组成,镜片可以是普通球面透镜,也可以是非球面透镜。虽然名称叫做中继透镜,但它并不是透镜。两组镜片,至少有两个配对透镜或两个配
  • 古越语古越语是古代于越人的语言,春秋时期通行于吴、越两国,与当时附近楚及中原诸国言语不同。语言学研究表明,古越语可能属于侗台语系,与现代的侗语、壮语、泰语等关系较近;但也有研究
  • 海盗湾海盗湾(英语:The Pirate Bay,缩写:TPB)是一个专门存储、分类及搜索Bittorrent种子文件及磁力链接的网站,由瑞典的民间反著作权组织海盗署(英语:Piratbyrån)于2003年成立,支持35种语言
  • 荷尔蒙疗法荷尔蒙疗法(英语:Hormone therapy)是任何形式的激素疗法,其中患者在治疗过程中接受激素,以补充缺乏天然存在的激素,或用其他激素代替天然存在的激素。用激素拮抗剂治疗也可称为抗