OCR

✍ dations ◷ 2025-07-18 22:41:44 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 药效学药物效应动力学(英语:Pharmacodynamics (PD) ),简称药效学,是药理学的一个分支,主要研究药物作用(action)与药理效应(effects)(即药物对机体的作用及作用机制(mechanism of action)
  • 免疫能力低下免疫缺陷(英语:immunodeficiency)是指免疫系统抵抗传染病的能力失常或欠缺。免疫缺陷还可能降低肿瘤免疫监视功能。免疫缺陷多为继发性(secondary)免疫缺陷,不过也有些人生来就有
  • SBR污水处理工艺SBR污水处理工艺,即序批式活性污泥法,全称为序列间歇式活性污泥法(Sequencing Batch Reactor Activated Sludge Process),简称SBR工艺。它是基于以悬浮生长的微生物在好氧条件下
  • 操作定义操作定义(operational definition)是指将一些事物如变量、术语与客体等以某种操作的方式表示出来。操作定义与概念型定义(英语:conceptual definition)相区别,强调确立事物特征时
  • 磷酸果糖激酶1结构 / ECOD磷酸果糖激酶1(Phosphofructokinase-1;PFK-1;EC 2.7.1.11)是一种糖解作用里一种重要的酶,是一种由4个次单位组成的异位(allosteric)酵素,可受多种活化剂与抑制剂调控。在
  • 法国文学法语文学(法语:Littérature française)是指用法语写成的文学,有时特指法国人用法语写成的文学,也可以指法国文学。现代法国人的起源非常复杂,主要由凯尔特人、日耳曼人和罗曼人
  • 皖南皖南是指中国安徽省南部地区,通常包括马鞍山市(除含山县、和县)、芜湖市(除无为县)、铜陵市、宣城市、黄山市、池州市等地区,即安徽省长江以南的地区。皖南地区的地形以山地为主
  • 阿丁顿第一代西德默斯子爵亨利·阿丁顿,PC(Henry Addington, 1st Viscount Sidmouth,1757年5月30日-1844年2月15日),英国托利党政治家,1801年至1804年出任英国首相。1757年,出生于伦敦的医
  • 退行发育(Anaplasia)逆行性生长(Anaplasia),是指成熟的正常细胞非正常地复归未成熟的细胞,为恶性肿瘤(malignant neoplasms)的指标性症状。大多数癌细胞会导致细胞去分化,让细胞无限制的分裂。但发生在
  • 王启明王启明(1934年7月3日-),中国光电子学家。生于福建。1956年毕业于复旦大学物理系。中国科学院半导体研究所研究员。1991年当选为中国科学院院士(学部委员)。