OCR

✍ dations ◷ 2025-06-28 13:09:47 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 锁骨锁骨 (英文:Clavicle;拉丁文:Clavicula)是爬行动物、鸟类和哺乳类动物肩胛带三骨之一。硬骨鱼身上已经有其痕迹,但两栖动物却没有锁骨。除了锁骨,还有喙状骨和肩胛骨,共同组成肩胛带
  • 血管神经性水肿血管神经性水肿是真皮、皮下组织(英语:subcutaneous tissue)、黏膜的局部肿胀。可发生于面部、舌头、喉、腹部、四肢。常与荨麻疹相关,荨麻疹是皮肤的红肿。 Onset is typically
  • 底比斯 (希腊)底比斯 (Thebes, /ˈθiːbz/; 古希腊语:Θῆβαι, Thēbai, 希腊语发音:; 希腊语:Θήβα, Thíva )又译作忒拜,是一座位于中希腊维奥蒂亚州的城市。因为这座城市是关于卡德
  • 以巴冲突进行中持续中的冲突以色列-巴勒斯坦冲突是持续中的冲突,为阿以冲突及中东战争的一部分。巴以冲突不能够简单地概括为所有以色列犹太人与所有巴勒斯坦阿拉伯人之间的双边冲突
  • 亨利·沃尔特·贝兹亨利·沃尔特·贝兹(英语:Henry Walter Bates,1825年2月8日-1892年2月16日),生于英国莱斯特,博物学家和探险家,是第一个对动物拟态现象作科学描述的人。他曾与阿尔弗雷德·华莱士一
  • 邓析邓析(前545年-前501年),春秋时代末年郑国思想家。名家的重要人物。 邓析与政治家子产同时,名家思想之创先者,著有《邓析子》, 有无厚篇与转辞篇两篇,无厚篇二十一段, 转辞篇十七段。
  • 兰博基尼兰博基尼公司(意大利语:Automobili Lamborghini S.p.A.,意大利语: 聆听)是一家集设计、工程、制造与销售于一身的超级跑车制造商,坐落于意大利圣亚加塔·波隆尼。1963年由费鲁齐
  • 维莱科特雷法令维莱科特雷法令(法语:Ordonnance de Villers-Cotterêts)由法国国王弗朗索瓦一世于1539年8月10日至25日期间在埃纳省小城维莱科特雷颁布。同年9月6日,巴黎高等法院将其载入法律
  • 观音洞文化观音洞可以指供奉观音的寺庙(多位于洞窟内),还有以此为名的地名及设施:
  • 齿轮齿轮(Gear或cogwheel)是轮缘上有齿能连续啮合传递运动和动力的机械零件,齿轮依靠齿的啮合传递扭矩。齿轮通过与其它齿状机械零件(如另一齿轮、齿条、蜗杆)传动,传动方式是啮合传动