首页 >
光学字符识别
✍ dations ◷ 2025-06-27 10:13:14 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
相关
- 古根菌纲古根菌纲(学名:Archaeorhizomycetes)是子囊菌门外囊菌亚门下的一个纲,发表于2011年,其下只有一个单型目古根菌目(Archaeorhizomycetales)、一个单型科古根菌科(Archaeorhizomycetace
- 大会会员资格 请参阅关于大会会员资格的两篇文章:联合国大会(简称联大)是联合国主要机构之一。联大首次会议于1946年1月10日在伦敦卫理公会中央礼堂召开,有来自51个国家的代表参与了
- 汤飞凡汤飞凡(1897年7月23日-1958年9月30日),幼名瑞昭,湖南醴陵人,微生物学家,砂眼衣原体首次分离者。为第一个投身病毒学研究的华人。曾任中华医学会理事、中国国家菌种保藏委员会主任委
- 卡洛·乌尔巴尼卡洛·乌尔巴尼(意大利语:Carlo Urbani,1956年10月19日-2003年3月29日),又译乌尔班尼或厄巴尼,意大利医生,是首位留意到SARS是一种全新传染病的医生。乌尔巴尼是无国界医生意大利分
- 巴尔奇克巴尔奇克 (保加利亚语:Балчик)是位于保加利亚东北部的城市。地处多布里奇州,黑海沿岸。巴尔奇克是海滨度假胜地。位于瓦尔纳东北42公里处。市区建在黑海沿岸的多布罗加台
- 勃艮第人勃艮第人(勃艮第语:Börguntan,拉丁语:Burgundiōnes, Burgundī,古诺斯语:Burgundar,英语:Burgundians,古英语:Burgendas,希腊语:Βούργουνδοι))属于东日耳曼民族的部落,可能是
- 事假事假是指劳工因个人事务,请雇主请假的假别。目前在包括中华民国等国在劳动法律中有规定天数。
- 语义角色语义角色(英语:Semantic roles),又称语义关系、主题关系(thematic relations),生成语法中称为题元或题元角色(θ-roles),在格语法中也称为语义格或深层格,是语义学上的一个概念,指短语或
- 植物种志《植物种志》(Species Plantarum) 为卡尔·林奈发表于1753年的两卷本植物学著作。其重要意义在于它是现存的最早为植物进行系统命名分类的著作。一些最早被普遍公认的植物科学
- 马焦雷湖马焦雷湖(Lago Maggiore)是位于意大利西北部的一个湖泊。马焦雷湖是意大利第二大湖泊,面积仅次于加尔达湖。部分湖域位于瑞士国境内。面积212.5平方公里,最大深度372米。