OCR

✍ dations ◷ 2025-06-07 17:59:53 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 卵形疟原虫卵形疟原虫(Plasmodium ovale)是一种疟原虫,可引发卵形疟,和另外两种主要的疟原虫(恶性疟原虫和间日疟原虫)相比较为少见。一般在感染后12-20天内发作,但有潜伏4年的案例存在。每次
  • 心房心房(拉丁语:Atrium)旧称䆝,是构成心脏腔室的一种。心脏分心房与心室,分别负责接收 左心房则可根据胚胎来源被分为左心耳和左心房窦。和原始静脉窦右角发展而来的腔静脉窦。在右
  • 长寿命裂变产物长寿命裂变产物一般指由核裂变反应产生的、半衰期超过20万年的放射性物质。这并非精确的科学定义,比如有人把某些半衰期在20年至100年间的裂变产物也称作长寿命裂变产物。另
  • 春运国务院中央军委测绘机构春运,即“春节期间的交通运输”的简称,是中国大陆在农历春节前后发生的一种大规模的高交通运输压力及堵塞的现象,一般发生在春节节前15天及节后25天左右
  • 精神分析学精神分析学(英文:Psychoanalysis)或称心理分析学,是于19世纪末期由奥地利神经学家西格蒙德·弗洛伊德的创立的一门学科。当时精神病学普遍受生物学的影响,对于心理现象的构成、发
  • 大路《大路》(意大利语:La strada)是意大利导演费德里柯·费里尼所执导的一部电影,也是他生涯的代表作之一,为影史上相当重要的一部作品。铁链表演者赞巴诺原先买来的女跟班死了,所以
  • 托利弗县托利弗县(Taliaferro County, Georgia)是美国乔治亚州中北部的一个县。面积506平方公里。根据美国2000年人口普查,共有人口2,077人,2005年人口1,826人,为全州最少。县治克劳福德
  • 高等院校根据法国法律,大学(法语:Université)一词所指的是法国公立科学、文化和专业机构中的综合性大学和一所国立理工学院。在法国还有一些大学与院校共同体、技术大学 (EPSCP,独立于大
  • 评剧评剧发源于中国唐山一带,特点是念白和唱词口语化,非常容易听懂,因此很受观众的欢迎。1910年代,成兆才将说唱曲艺艺术莲花落结合蹦蹦戏,并吸收河北梆子、京剧的一些表演方式和音乐
  • 雄性激素雄激素(英语:androgen、英语:androgenic hormones或英语:testoids),也译为雄性激素、男性激素、男性荷尔蒙,是一种化学成合物的泛称。在于脊椎动物中,凡是能够与雄激素受体(androgen