首页 >
OCR
✍ dations ◷ 2025-04-25 05:34:55 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
相关
- 氢氧电池氢氧电池(OXYRIDE)是一款新品种的干电池,由日本松下电器(Panasonic)所发明、并于2004年上市发售。氢氧电池的电容量较大,一般情况下,其使用寿命约是碱性电池的 1.5 倍。这使其非常
- 送气与不送气送气(Aspiration),语音学概念,指某些阻碍音在除阻时所伴随的强烈的空气喷吐。为感知送气与不送气音之间的差别,试将一只手或点燃的蜡烛置于口前,朗声说“滩”(/tʰan/)、“单”(/t
- 家用电器家用电器,简称家电,是指以电能来进行驱动(或以机械化动作)的家庭用具,可帮助执行家庭杂务,如炊食、食物保存或清洁。基本上,家用电器分为大型家电(白色家电、黑色家电)和小家电。大型
- 佛罗勒斯人佛罗勒斯人(学名:Homo floresiensis)是近年发现的一种史前人类,为人属的一种,主要特征是体型小,大脑小,因此也被化名作“霍比特人”。他们居住在印尼弗洛勒斯岛上,直到可能约12000年
- 英国皇家海军陆战队英国皇家海军陆战队(英语:Corps of Royal Marines,缩写为RM),属于英军的轻装步兵,并兼为两栖作战或海陆空协同作战部队,及雪地作战、山地作战专门部队,与英国皇家海军共同组成女王陛
- 奥克尼群岛奥克尼(英语:Orkney、苏格兰盖尔语:Arcaibh),是英国苏格兰东北部一群岛,南距苏格兰本土仅10英里左右,是苏格兰32行政区之一。该群岛由70个左右的岛屿组成,总面积990平方公里,其中20个
- 脱氨化脱氨作用(英语:deamination,亦可称为脱氨基)是指移除分子上的一个氨基。人类的肝脏经由脱氨作用将氨基酸分解,当氨基酸的氨基被去除之后,会转变成氨。由碳及氢所组成的残余部分,则
- 青铜器青铜器是由青铜(多为铜和锡、铅的合金,其中锡和铅的成分都必须大于2%。另有十多种配方)制成的各种器具,诞生于人类文明的青铜时代。由于青铜器在世界各地均有出现,所以也是一种世
- 威廉·拉塞尔威廉·拉塞尔(英语:William Lassell,1799年6月18日-1880年10月5日),英国天文学家,出生于博尔顿。拉塞尔早年曾从事啤酒酿造行业,积聚了不少财富,从而可以毫无顾虑的发展其对天文学的
- 串扰串扰(英文:crosstalk),又称串音干扰,是电子学和通信学的专业术语。串扰在电子学上是指两条信号线之间的耦合现象。这是因为空间距离近的信号线之间会出现不希望的电感性和电容性