光学字符识别

✍ dations ◷ 2024-12-22 19:52:02 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 食欲不振食欲不振(英语:Anorexia),也作食欲减退、食欲缺乏,民间常称“没胃口”,是指食欲降低的一种症状。虽然在许多非科研出版物中该词也可指代神经性厌食症,但是食欲不振的成因却多种多样
  • 尘土土壤(德语:Boden,英语:soil)是一种自然体,由数层不同厚度的土层(德语:Bodenhorizont,英语:soil horizon)所构成,主要成分是矿物质。土壤和母质(岩石)的差异主要是表现在形态特征或物理、化
  • 血糖血糖(英语:Blood sugar)是指血液中的葡萄糖。消化后的葡萄糖由小肠进入血液,并被运输到机体中的各个细胞,是细胞的主要能量来源。国际标准单位是毫摩尔/升(mmol/l)。美国采用毫克/
  • 维克多·弗兰克维克多·弗兰克(Viktor Emil Frankl,1905年3月26日-1997年9月2日)是一位奥地利神经学家、精神病学家,维也纳第三代心理治疗学派 - 意义治疗与存在主义分析(Existential Psychoanal
  • 语言哲学语言哲学是一门哲学的分支,对语言的用法、来源及本质作理性的研究。对于分析哲学来说,有四个主要关心的问题:意义的本质、语言用法、语言认知及语言与现实的关系。对欧陆哲学家
  • 牙床牙龈(又称龂;俗称牙床、牙花子;客家话称牙舷肉),牙龈由软组织构成。牙龈位于牙齿根部(称为牙根)周围。护理牙龈与护理牙齿一样重要。是人或动物口腔内的粘膜组织,下接牙槽骨的骨膜,向
  • 本生灯本生灯是科学实验室常用的高温加热工具之一。该工具以德国化学家罗伯特·威廉·本生的名字命名,而实际上是由他的助手彼得·迪斯德加(Peter Desaga)在1855年改良法拉第原先的一
  • 山梨县山梨县(日语:山梨県/やまなしけん Yamanashi ken */?)是日本本州中部地方的一个县,相当于过去的甲斐国,首府是甲府市。向东是东京都和神奈川县,离东京市区约120公里,向南是静冈县,
  • 鲁诗《诗经》是中国最早的诗歌总集,收录自西周初年至春秋中叶(约前11世纪-前6世纪)的诗歌305篇(除此之外还有6篇有题目无内容,即有目无辞,称为笙诗六篇,题目分别是南陔、白华、华黍、由
  • 感测器传感器(英语:Sensor)是用于侦测环境中所生事件或变化,并将此消息发送出至其他电子设备(如中央处理器)的设备,通常由敏感组件和转换组件组成。传感器是一种物理设备或生物器官,能够探