首页 >
光学字符识别
✍ dations ◷ 2025-11-13 14:49:33 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
相关
- 国家情报总监办公室议长:南希·裴洛西(民主党) 多数党领袖(英语:Party leaders of the United States House of Representatives):斯坦利·霍耶(民主党) 少数党领袖(英语:Party leaders of the United Sta
- 脾脾脏是脊椎动物的一种外周淋巴器官。人类的脾脏位于腹腔的左上方,由红髓、白髓、边缘区,以及将之被覆的被膜、小梁组成。健康成人的脾脏约重150-200克:68。活体时,脾为暗红色,质
- 体适能体适能(英语:Physical Fitness),为身体适应外界环境之能力,可视为身体适应生活、运动与环境 (例如,温度、气候变化或病毒等因素)的综合能力。它包含了两个面向,一般素质(身体健康的状
- The Lancet《柳叶刀》(The Lancet),是世界上最悠久及最受重视的同行评审医学期刊之一,主要由爱思唯尔出版公司发行,部分与里德·爱思唯尔集团协同出版。1823年由汤姆·魏克莱(英语:Thomas Wak
- 卡利什卡利什 (波兰语:Kalisz)是位于波兰中部的一个城市。属大波兰省管辖。卡利什是一个重要的区域工业及商业中心。市内有许多知名的工厂,如Calisia钢琴厂。卡利什也是一个传统民间艺
- 交感神经系统交感神经(拉丁语: Sympathicus)和副交感神经共同组成自主神经系统。大部分的器官受到两者的共同支配,大部分情况下,两者相互拮抗(例外:唾液分泌),因而可以实现对该器官的精细调节,实
- 国立卫生研究院 (美国)美国国家卫生院(英语:National Institutes of Health,缩写为NIH),隶属于美国卫生及人类服务部,是美国联邦政府中首要的生物医学研究机构。2006年的资料显示,此机构花费美国全国28%
- 物质状态物质状态是指一种物质出现不同的相。早期来说,物质状态是以它的体积性质来分辨。在固态时,物质拥有固定的形状和容量;而在液态时,物质维持固定的容量但形状会随容器的形状而改变
- 塔恩省塔恩省(法语:Tarn)是法国朗格多克-鲁西永-南部-比利牛斯大区所辖的省份。该省编号为81。5个海外省及大区
- 柔性印刷电路板柔性印刷电路板(Flexible Printed Circuit,FPC)又称为柔性线路板、软性电路板、软性线路板、挠性线路板、软板等,是一种特殊的印制电路板。它的特点是重量轻、厚度薄、柔软、可
