光学字符识别

✍ dations ◷ 2024-07-07 20:48:28 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 躁郁症躁郁症(英语:bipolar disorder,亦称双相情感障碍、情绪两极症,早期称为躁狂抑郁疾病、manic depression),是一种精神病经历情绪的亢奋期和抑郁期。情绪亢奋期(躁期)可分为“狂躁”或
  • 第2型糖尿病2型糖尿病(英语:Diabetes mellitus type 2,简称T2DM,台湾称为第二型糖尿病),大陆旧称为非胰岛素依赖型糖尿病(英语:noninsulin-dependent diabetes mellitus,简称NIDDM)或成人发病型糖
  • 广州医学院广州医科大学简称广医,其始建于1958年,是一所以培养高等医学人才为目的,以医学为优势和特色的全日制高等医科院校。广医下设16个学院,8所直属附属医院和10所非直属附属医院,19个
  • 宾语・受词受词或称宾语(英语:Object)、受词,是指一个动作(动词)的接受者。例句“我写作业”中,“作业”即为受词。宾语分为直接受词和间接受词两大类,其中直接受词指动作的直接对象,间接受词
  • 内窥镜内窥镜(内射镜)(endoscopy (looking inside))泛指经各种管道射入人体,以观察人体内部状况的医疗仪器。部分内窥镜同时具备治疗的功能,如膀胱镜、胃镜、大肠镜(英语:Colonoscopy)、
  • 本列表仅列出现存种类,关系为并列 详见鱼类分类表鱼类属于脊索动物门中的脊椎动物亚门,人类的日常语言中,鱼类被用于指脊椎动物中除去四足动物后剩下的一部分生物。鱼这个词是
  • 罗尔夫·马克西米利安·希沃特罗尔夫·马克西米利安·希沃特(瑞典语:Rolf Maximilian Sievert,1896年5月6日-1966年10月3日,瑞典语发音:)是一位瑞典生物物理学家、辐射防护专家,他主要贡献于研究辐射对生物体的影
  • 尼克·何伦亚克尼克·何伦亚克(英语:Nick Holonyak,乌克兰语:Микола Голоняк,1928年11月3日-),出生于伊利诺伊州齐格勒,美国物理学家,于1962年发明了第一台实用的可见光发光二极管,担任
  • 马尔科姆一世马尔科姆一世(盖尔语:Máel Coluim mac Domnaill;英语:Malcolm I;约900–954年)是苏格兰国王(943年–954年在位)。在堂叔君士坦丁二世隐居修道院时继承王位,可能因为君士坦丁在位时间
  • 硫酸盐制浆法硫酸盐制浆法是一种用于生产纸浆的工艺,在被称为蒸煮器的大型压力容器中,使用氢氧化钠和硫化钠将木质素从碎木片中分离,从而获得以纤维素为主要成分的纸浆。一些蒸煮器采用间歇