首页 >
OCR
✍ dations ◷ 2025-05-16 04:09:43 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
相关
- 强碱在各种酸碱理论中,碱都是指与酸相对的一类物质。碱多指碱金属及碱土金属的氢氧化物,而对碱最常见的定义是根据阿伦尼乌斯(Arrhenius)提出的酸碱离子理论作出的定义:碱是一种在水
- α-酮戊二酸脱氢酶复合体酮戊二酸脱氢酶复合体(英语:oxoglutarate dehydrogenase complex,缩写OGDC;或称英语:α-ketoglutarate dehydrogenase complex)是一个复合酶,因其在三羧酸循环中的作用而众所周知。
- 哈罗德·尤里哈罗德·尤里(英语:Harold Urey,1893年4月29日-1981年1月5日),美国科学家,因发现氢的同位素氘获得1934年诺贝尔化学奖。此外,尤里和史丹利·米勒于1953年完成了生命起源的经典实验米
- 蓝丝黛尔石蓝丝黛尔石(Lonsdaleite)也译做郎士德碳,又因晶体结构及特性称作六方金刚石(hexagonal diamond)、六方碳。蓝丝黛尔石是一种六方晶系的金刚石,属于碳同素异形体的一种构形,咸信为流
- 眼虫属眼虫藻(学名:Euglena)是生物里的一个属,属于裸藻纲。其名字的来源是因为它们有眼斑,它与趋光有关。眼虫为长梭形或圆柱形而带扁平的单细胞藻体,由前端小凹陷生出细长鞭毛一条,其运
- 术语术语又称技术名词、科学术语、科技术语或技术术语,是在特定专业领域中一般概念的词语指称,一个术语表示一个概念。研究术语的学科有术语学。由于文化差异,不同语种间的翻译也常
- ClOsubix/sub氯和氧之间可以形成很多种化合物:此外,氯与氧还能形成多种阴离子:
- 百优解氟西汀(英语:Fluoxetine),商品名为百忧解(Prozac)是一种选择性5-羟色胺再摄取抑制剂(SSRI)类抗抑郁药。在临床上用于治疗成人重性抑郁障碍、强迫症、神经性暴食症,还用于治疗具有或不
- 753Template:Congenital malformations and deformations of nervous system Template:Congenital malformations and deformations of eye Template:Congenital malformations
- 自杀式袭击自杀攻击或称自杀式袭击、人肉炸弹,是一种将自杀扩大为伤害自己及目标者的行为,现代的自杀式攻击通常是由自杀者在身上绑好炸弹,走到目标地,或是以装满炸弹的车冲撞特定目标然后