OCR

✍ dations ◷ 2025-11-29 18:40:20 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • Og5f14 6d10 7s2 7p6(预测)2, 8, 18, 32, 32, 18, 8(预测)第一:860.1(预测) kJ·mol−1 第二:1560(预测)面心立方主条目:鿫的同位素鿫(,英语:Oganesson)是一种人工合成的化学元素,化学符号为O
  • 奶豆腐奶豆腐,蒙古民族奶食品之一,属于奶制品。 其作法先将酸奶子中的奶油提取出后,将其中水分煮干使其凝固,再放入模子中成型或以布袋挤压成型之后晒干可食用且便有保存。奶豆腐可分
  • 分形分形(英语:fractal,源自拉丁语:frāctus,有“零碎”、“破裂”之意),又称碎形、残形,通常被定义为“一个粗糙或零碎的几何形状,可以分成数个部分,且每一部分都(至少近似地)是整体缩小后
  • 主族金属主族金属是指周期表中s区及p区的金属元素,包括碱金属、碱土金属及铝、镓、铟、铊、锡、铅及铋等元素。主族金属容易参加化学反应,其氧化态较低。反应后大都形成离子键化合物。
  • 首席大法官美国首席大法官(Chief Justice of the United States)是美国联邦政府司法部门的领袖并主管美国最高法院。首席大法官是美国最高司法官员,领导最高法院的事务并在弹劾美国总统时
  • 小肠细菌过度生长小肠细菌过度生长(Small intestine bacterial overgrowth)简称SIBO,是小肠内细菌过度生长的疾病。小肠和大肠不同,大肠内含有大量的细菌,而正常情形下小肠的细菌数量是每毫升小于
  • 基因的自由组合定律基因的自由组合定律,或称基因的独立分配定律,是遗传学的三大定律之一(另外两个是基因的分离定律和基因的连锁交换定律),由奥地利遗传学家孟德尔(G.J.Mendel,1822-1884)经豌豆杂交试验
  • 蓝莓蓝莓,狭义是指一群越橘属越橘亚属青液果组(学名:Cyanococcus)的开花植物,广义上可以包括越橘属中长有蓝色浆果的所有物种。这些种的植物原生于北美洲与东亚,为灌木,高度可从10公分
  • X射线结晶学X光散射技术或X射线衍射技术(英语:X-ray scattering techniques)是一系列常用的非破坏性分析技术,可用于揭示物质的晶体结构、化学组成以及物理性质。这些技术都是以观测X射线穿
  • 通奸通奸(英语:adultery),源自拉丁文的adulterium,又称为婚外性行为,是法律和道德性质的名称。一般指在一定情况下发生而违反法律或道德的人类性行为,通常泛指有配偶者与第三者出于自愿