OCR

✍ dations ◷ 2025-04-04 11:30:19 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 玻那病毒玻那病毒科(Bornavirus),又称博尔纳病毒科、鲍那病毒科,RNA病毒的一种,属单股负链病毒目。其下仅有玻那病毒属(Bonavirus),目前只有一个病毒被发现,玻那症病毒(Borna disease virus
  • 细菌感染病原细菌(英语:Pathogenic bacteria)是指能导致传染病的细菌病原体。本条目主要针对会造成人类传染病的病原细菌。大部分的细菌是无害,甚至是有益的,不过有些细菌是病原体。像结
  • 阿卡德语阿卡德语(akkadû,
  • 拉斯克公共卫生特别奖拉斯克奖(英语:Lasker Award),始自1946年的年度奖,奖励取得了重大医学科学贡献的在世医学研究者。拉斯克奖素有“美国的诺贝尔奖”之美誉,是美国最具声望的生物医学奖项,也是医学界
  • 酵素免疫分析法酶联免疫吸附试验(又称酵素免疫分析法,Enzyme-linked immunosorbent assay (ELISA),简称酶联法)利用抗原抗体之间专一性键结之特性,对检体进行检测;由于结合于固体承载物(一般为塑
  • 菟丝子菟丝 (学名:Cuscuta chinensis),为旋花科菟丝子属下的一个种,植株通常呈淡黄色的旋花科寄生植物。中国大陆 (东北、河北、陕西、四川、河南、山东、广东)、台湾、韩国、日本。菟
  • 第br /七第八第十埃及第七王朝是埃及历史上的一个王朝。埃及第七王朝成立在约前2181年左右,是一个非常短暂的王朝,只维持了七十天,却有七十个法老,是埃及历史上的一个混乱的王朝,文献记载
  • 德国经济$45,925 (国际汇率) $40,756 (购买力平价)德国是欧洲最大经济体,全球国内生产总值第四大国(国际汇率),以及国内生产总值第五大国(购买力平价)。从工业革命时
  • C04A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码C04(外周血管扩张剂)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Coll
  • NaMnOsub4/sub高锰酸钠是一种无机化合物,化学式为NaMnO4。高锰酸钠是一种红紫色晶体或粉末,不易得到无水物。易溶于水、乙醇和乙醚,溶于液氨。氧化性较强。易潮解,因此应用不如高锰酸钾广泛。