光学字符识别

✍ dations ◷ 2025-04-03 17:14:14 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • 萨兰达萨兰达(阿尔巴尼亚语:Sarandë)是位于阿尔巴尼亚南部的一个沿海城市,属夫罗勒州萨兰达区一部分。萨兰达是阿尔巴尼亚全国最重要的旅游城市之一,其附近的文化古城布特林特被列入世
  • 内务省内务省是日本在 1873 年 11 月 10 日设置、1947 年 12 月 31 日废止的中央官厅,其职掌是地方行政和财政、警察、土木工程、卫生等等国内行政。从一开始就反映了初代内务卿大
  • 卡尔达肖夫指数卡尔达肖夫指数(英语:Kardashev Scale)是根据一个文明所能够利用的能源量级,来量度文明层次及技术先进程度的一种假说。1964年苏联天文学家尼古拉·卡尔达肖夫首先提出用能量级
  • 烹饪烹饪,又称烹调、烹煮、炊煮、造饭、做菜,指将食材处理并制作成食物、菜肴、餐点、膳食的方法。一个好的菜肴,色香味形俱佳,不但让人在食用时感到满足,而且能让食物的营养更容易被
  • 膀胱顶膀胱是哺乳动物贮尿的囊状器官,功能是暂存和排泄小便。经肾脏过滤之后的含有代谢产物的体液流入膀胱,形成尿液;当排尿时,膀胱壁的肌肉收缩,出口处的括约肌放松。膀胱是中空的、由
  • 爿部,为汉字索引中的部首之一,康熙字典214个部首中的第九十个(四划的则为第三十个)。就中文而言,爿部归于四划部首。爿部只以左方为部字;而无其他部首可用者也会将部首归为爿部。1
  • 谷部,为汉字索引中的部首之一,康熙字典214个部首中的第一百五十个(七划的则为第四个)。就繁体和简体中文中,谷部归于七划部首。谷部通常从左方、右方为部字。且无其他部首可用者
  • 博赛纳湖博赛纳湖 (意大利文: Lago di Bolsena) 是一个位于意大利中部的湖。它是在约300,000年前,因为威西尼山脉(Vulsini mountain range)的一些火山口爆发而形成的。博赛纳湖呈椭圆形
  • 滨海夏朗德省滨海夏朗德省 (17) (法语:Charente-Maritime)是法国的一个省。滨海夏朗德省创立于法国大革命时期,1789年12月22日立法,1790年5月4日生效。此省是来源于原先的奥尼和散舵芝(Aunis e
  • 唐诗唐诗泛指创作于唐代(618年—907年)的诗,也可以引申指以唐朝风格创作的诗。唐诗上承魏晋南朝诗,下开宋诗,唐代也被视为中国历来诗歌发展最盛的黄金时期,因此有与宋词并举之说。唐代