光学字符识别

✍ dations ◷ 2025-09-13 08:11:21 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 绝症绝症(英语:Incurable deadly disease)是医学意义上无法医治的致命永久性疾病。有些疾病在以前是绝症,之后出现治疗方法后就不再是绝症,所以绝症这个词有时效性。某些疾病在医理上
  • 循环系统疾病心血管疾病(英语:cardiovascular disease,簡稱CVD)指的是关于心脏或血管的疾病,又称为循环系统疾病、循环系统疾病。常见的心血管疾病包括冠状动脉症候群、中风、高血压性心脏病(
  • 非编码非编码核糖核酸(英语:non-coding RNA),缩写ncRNA,是指各种不翻译成蛋白质的RNA分子。过去也称此类RNA为小核糖核酸(sRNA)。不过有些ncRNA分子其实相当大。其他较少使用的同义词还有
  • 铝合金铝合金通常使用铜、锌、锰、硅、镁等合金元素,20世纪初由德国人Alfred Wilm发明,对飞机发展帮助极大,第一次大战后德国铝合金成分被列为国家机密。跟普通的碳钢相比有更轻及耐
  • 辣椒粉辣椒粉,又称辣椒面,是干燥后的辣椒磨成的碎片或粉末。根据粗细不同,英文会区分辣椒片(chili flake)和辣椒粉(chili powder),但中文里常通称辣椒粉。几乎世界各地的料理都有在烹调过
  • 无腔动物门无腔动物亚门(学名:Acoelomorpha)是异无腔动物门下的一个亚门。它们拥有浮浪幼虫样动物的特征,以往被认为是属于后口动物,但有学者将它们成立为一个独立于后口动物的门。经过miRN
  • 党进党进(927年~977年),北宋初年将领。朔州马邑 (今山西朔县)人。早年在魏帅杜重威任给事。杜重威失败后,因膂力过人在军伍中任职。后周时为铁骑都虞侯。宋太祖乾德五年,担任彰信军节
  • 伊儿汗国伊儿汗国(蒙古语:.mw-parser-output .font-mong{font-family:"Menk Hawang Tig","Menk Qagan Tig","Menk Garqag Tig","Menk Har_a Tig","Menk Scnin Tig","Oyun Gurban Ulus
  • 马里奥·苏亚雷斯马里奥·阿尔贝托·诺布雷·洛佩斯·苏亚雷斯(葡萄牙语:Mário Alberto Nobre Lopes Soares,1924年12月7日-2017年1月7日),葡萄牙政治家,曾任葡萄牙总统及总理。在2007年票选最伟大
  • 170110 数学 120 信息科学与系统科学 130 力学 140 物理学 150 化学 160 天文学 170 地球科学 180 生物学210 农学 220 林学 230 畜牧、兽医科学 240 水产学310