光学字符识别

✍ dations ◷ 2025-08-24 03:20:36 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 秘书处联合国秘书长联合国秘书处(英语:United Nations Secretariat;法语:le Secrétariat des Nations unies)是联合国六个主要机构之一,与联合国大会、安全理事会、经济及社会理事会、
  • 放射治疗放射治疗(英语:Radiation therapy)或简称电疗,是使用电离辐射作为治疗疾病的方式。与放射治疗有关的医学专业称为放射肿瘤学或放射治疗学。执行这个专业的医疗从业人员称为放射
  • 线性回归在统计学中,线性回归(英语:linear regression)是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回
  • 汤匙汤匙(tablespoon,简称tbsp,又译餐桌匙),是一种进食用的匙,以及一个容量单位,其最常见的用途为喝汤,因而得名。汤匙有烹调上也是一种容量量度单位。不同国家对汤匙的标准并不一样,但通
  • 布拉格布拉格(捷克语:Praha;德语:Prag),是捷克首都和最大城市、欧盟第十四大城市,和历史上波西米亚的首都,位于该国的中波希米亚州、伏尔塔瓦河流域。该市地处欧洲大陆的中心,在交通上一向
  • 水杨酰胺水杨酰胺是一种属于水杨酸盐类的物质,通常作为止痛药及退烧药的成分之一。然而,水杨酰胺与亚士匹灵一样,均可令儿童患上雷尔氏综合症,因此不适合儿童服用。水杨酰胺有一种衍生物
  • 比重计比重计是用来测量液体的比重的装置。比重计通常用玻璃制作,上部是细长的玻璃管,玻璃管上标有刻度,下部较粗,里面放了汞或铅等重物,使它能够竖直地漂浮在水面上。测量时,将待测液体
  • 卡西米尔·冯克卡西米尔·冯克(波兰语:Kazimierz Funk注,1884年2月23日-1967年1月19日),波兰生物化学家。他的主要贡献是在1912年明确阐述了维生素的概念。卡西米尔·冯克1884年出生于波兰华沙,父
  • 趋向性趋性(英语:taxis,或称为趋向性)是一生物(或细胞)天生的行为反应,指其对一指向性刺激(由特定方向给的刺激),而会有趋进(正趋性)或远离(负趋性)刺激源的动作。趋性和向性不同,生物的
  • 查尔斯·狄更斯查尔斯·约翰·赫芬姆·狄更斯(英语:Charles John Huffam Dickens,1812年2月7日-1870年6月9日),维多利亚时代英国最伟大的作家,生活见长的作家。狄更斯的作品在其有生之年就已有空