光学字符识别

✍ dations ◷ 2025-01-23 10:28:08 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 闭塞性细支气管炎闭塞性细支气管炎(英语:Obliterative bronchiolitis (OB),缩写为OB;constrictive bronchiolitis;popcorn lung),是因为发炎造成肺部细支气管阻塞的疾病。症状包括干咳、呼吸急促、
  • 冠状动脉疾病冠状动脉疾病(英语:coronary artery disease, CAD)又称为缺血性心脏病或简称冠心病(英语:ischemic heart disease, IHD)、冠状动脉粥状硬化心脏病、冠状动脉粥状硬化心血管疾病(英
  • β-受体阻滞药β受体阻断药(英语:Beta blockers),又称Beta受体阻断药、β受体阻断剂、β受体阻滞剂、β受体拮抗剂或β阻断药、乙型阻断剂,是一类用来治疗心律不齐、防止心脏病发作后的二次心
  • 副粘液病毒亚科副黏液病毒亚科(Paramyxovirinae),属于副黏液病毒科,包括:
  • 发展迟缓广泛性发育障碍(Pervasive Developmental Disorder;简称PDD),又称社交障碍、发育迟缓,是一个与特殊性发育障碍(Specific Developmental Disorders;SDD)相对的名词,专指一组五种与多种
  • 二专二年制专科学校简称二专,为实施台湾二年制专科教育学制的学校机构。招收对象为技术型高级中等学校之毕业生,或同等学历参加四技二专统一入学测验后,以技优甄保、推荐甄试、登记
  • 古物古物是指各时代、各族群经人为加工具有文化意义之艺术作品、生活及礼仪器物及图书文献等:12。或可供鉴赏、研究、发展、宣扬而具有历史及艺术价值或经教育部指定之器物,分为
  • 慢性消耗病慢性消耗性疾病(英语:chronic wasting disease,缩写为CWD),又称鹿慢性消耗病、狂鹿症,一种发生在鹿科动物的传染病。是传染性海绵状脑病的一种,由变性普利昂(prion)子引起,会引起中枢
  • 栃木三鹰椒香花小辣椒是河南省淅川县香花镇的一个辣椒品种。香花镇于1978年从日本引进栃木三鹰椒种植,之后经过培育和改良,形成了色泽鲜红、肉质肥厚、角小、辣味浓、油分高的一个辣椒品
  • 320110 数学 120 信息科学与系统科学 130 力学 140 物理学 150 化学 160 天文学 170 地球科学 180 生物学210 农学 220 林学 230 畜牧、兽医科学 240 水产学310