OCR

✍ dations ◷ 2025-09-26 22:46:11 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • ICD人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学国际疾病与相关健康问题统计分类(英语:I
  • 戊糖戊糖(英语:Pentose),又称为五碳糖,是一种含有5个碳原子的单糖。在1号碳上有醛基的称为五碳醛糖(戊醛糖);2号碳上有酮基的称为五碳酮糖(戊酮糖)。戊醛糖有3个手性中心,因此可能有8种旋光
  • 欧洲药典《欧洲药典》(European Pharmacopoeia)为欧洲药品质量检测的惟一指导文献。第9版收录了总论及个论共计3000篇,适用于38个欧洲国家,并在全球100多个国家使用,内容涉及各种化学物质
  • 自然系统《自然系统》(拉丁语:Systema Naturae ,亦作:Systema Naturæ)是瑞典植物学及动物学学家、医生卡尔·林奈(Carl von Linné,1707-1778)的主要作品之一,这本书在植物及动物学两界引入
  • 5f4 6d1 7s22, 8, 18, 32, 22, 9, 2蒸气压主条目:镎的同位素镎(Neptunium,台湾译作錼)是一种化学元素,符号为Np,原子序为93。镎是首个超铀元素,属于锕系金属。镎具有放射性,其最稳定
  • 和亲和亲,又可称和蕃,是指东亚君主将自己或宗室的女儿或国内其他女性嫁给他国君主以示两国友好,增进彼此关系,具有政治目的联姻。一个国家内部不同政治集团的联姻不算在内。中国的和
  • 飞毛腿哈罗德哈罗德一世(英文:Harold I ,1016年-1040年3月17日),也称作飞毛腿哈罗德,是英格兰自1035年11月12日至1040年3月17日间的国王,外号“飞毛腿”(Harefoot)来自于他打猎时的速度和技巧。哈
  • 斯韦母亲斯韦母亲(瑞典语:Moder Svea)是瑞典王国的女性化身与国家的爱国主义象征。她普遍被认为是一位强大的女战士、瓦尔基里或是因神召而战斗的武者,并通常手持着盾牌立在一头雄狮身旁
  • 阎君阎罗王(梵语:यमराज,IAST:Yamaraja),源自印度教神祇阎魔罗阇(或译阎摩、阎魔、阎魔大王),是地狱的主宰,随着佛教传入中国,华人尊称其为阎魔罗阇大王,简称阎罗王、阎王、阎君。罗阇即
  • 欧登塞欧登塞(丹麦语:Odense 发音 帮助·信息)是丹麦第三大城市,南丹麦大区的首府,丹麦第二大岛菲英岛的第一大城。1970年之前归欧登塞省管辖,1970年到2006年底划归菲英省,2007年1月1日