首页 >
光学字符识别
✍ dations ◷ 2025-10-03 18:04:07 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
相关
- 50S50核糖体亚基是原核细胞内70S核糖体中的较大亚基。该亚基由一条5S rRNA、一条23S rRNA及约34个核糖体蛋白质分子构成,在原核翻译中负责在tRNA转运来的氨基酸分子之间形成肽键
- 副粘液病毒科副粘液病毒科包括二个亚科,副粘液病毒亚科(Paramyxivirinae)及肺炎病毒亚科(Pneumovirinae)。副粘液病毒亚科除已归类六属病毒外,还有尚未归类之马麻疹病毒属(Equine Morbilli
- 氯化钾氯化钾(化学式:KCl),英文:Potassium chloride。盐酸盐的一种,白色结晶或结晶性粉末,易溶于水和甘油,难溶于醇,不溶于醚和丙酮。氯化钾在农业上是常用的肥料(一般称为“钾肥”),在台湾俗
- 先天缺陷先天性障碍,又称先天性疾病、先天畸形、先天缺陷,是指发育中的胎儿因为遗传性疾病或发育环境等因素导致某个部位特征结构畸形,导致在婴儿出生时即有的病症,包括了身体(英语:Physic
- 史密斯纸草文《艾德温·史密斯纸草文稿》(Edwin Smith Papyrus)是约于公元前1600-1700年间完成的医学论文集:70,也是人类史上第一部关于创伤的外科医学著作,由莎草纸写成,长约5米(因为损毁只剩
- 洗澡洗澡,又名沐浴,是个人卫生活动,但是也可能在社交场合,例如公众浴室、桑拿浴等。沐浴有分洗身和泡澡,前者用水与沐浴乳清洁身体;后者的主要目的并非洗身,而是浸泡身体。十四世纪中黑
- 光线在太阳引力场中的偏折广义相对论中的开普勒问题,是指在广义相对论的框架下求解存在引力相互作用的两体动力学问题。在典型情况下以及本文中,其中一个物体的质量 m
- 皮尤研究中心皮尤研究中心(Pew Research Center)是美国的一间民调机构和智库机构。建立于2004年,总部设于华盛顿特区。该中心对那些影响美国乃至世界的问题、态度与潮流提供信息资料。皮尤
- 北美山区时区北美山区时区(Mountain Time Zone),标准时间(Mountain Standard Time,简称MST)为UTC-7,夏令时(Mountain Daylight Time,简称MDT)为UTC-6。亚利桑那州大部分地区不使用夏令时。
- 迪拜国际机场迪拜国际机场(阿拉伯语:مطار دبي الدولي,IATA代码:DXB;ICAO代码:OMDB)是阿拉伯联合酋长国迪拜的主要机场,为阿联酋航空的枢纽港。可起降目前所有的机型,是中东地区重