OCR

✍ dations ◷ 2025-01-23 02:12:14 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 消化道出血消化道出血(英语:gastrointestinal bleed (GI bleed)、gastrointestinal hemorrhage)是口腔至直肠之间任何部位的消化道出血。当短时间内大量出血时,可能导致的症状包含呕血、吐
  • 人口增长率人口自然增长率指一定时期内人口自然增长数(出生人数减死亡人数)与该时期内平均人口数之比,通常以年为单位计算,用千分比来表示,计算公式为:人口自然增长率 = (年内出生人数 - 年内死
  • 德国痳疹风疹(英语:rubella, German measles, three-day measles),又称德国麻疹或三日麻疹,是一种由风疹病毒(英语:Rubella virus)感染所造成的疾病。本病的症状轻微,半数患病者通常不会有自
  • 胆癌胆癌是发生在胆部的恶性肿瘤,常见的有胆管癌、胆囊癌和肝外胆管癌三种。胆癌并不常见,通常会发生在六至七十岁人士身上。原发性胆管癌较少见,性别以男性为多。中上腹及右上腹疼
  • 作曲家作曲家是专门创作音乐的音乐家。在过去,大部分的音乐家都会作曲,但在分工细密的现代社会,作曲家、演奏家甚至指挥家等,已经成为截然不同的音乐家类型。历史上有许多创作的类型,像
  • 功能主义建筑在建筑中,功能主义(英语:functionalism)是指建筑应该仅根据其用途和功能进行设计的原则。按照此原则设计的建筑称为功能主义建筑。该原则在行业内是一个令人困惑且有争议的问题,
  • 麦角灵麦角灵是一种化合物,其结构骨架被包含在一个多种多样化的生物碱里。 麦角灵衍生物在临床上用于血管收缩(5-HT受体(英语:5-HT1 receptor)激动剂,麦角胺)的目的,用于偏头痛的治疗和减
  • 捷克克朗捷克克朗为捷克所通用的货币。纸币面额有20、50、100、200、500、1000、2000和5000克朗。硬币面值有10、20、50赫勒;1、2、5、10、20和50克朗。1克朗=100赫勒。货币符号为Kč
  • 水杨酸类药物水杨酸(英语:Salicylic acid,源于拉丁文的“杨柳” salix),又名柳酸、邻羟基苯甲酸、2-羟基苯甲酸。水杨酸易溶于乙醇、乙醚、氯仿、苯、丙酮、松节油,不易溶于水,20°C时溶解度为
  • 亚硫酸盐定序亚硫酸盐定序(英语:bisulfite sequencing)是一种利用亚硫酸盐处理,测定DNA甲基化情形的方法。DNA甲基化是最早被发现的表观遗传标记,也是被研究最为深入的表观遗传改变。原理在于