首页 >
光学字符识别
✍ dations ◷ 2024-11-05 22:47:08 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
相关
- 绿非硫细菌绿弯菌门(Chloroflexi)是一类通过光合作用产生能量的细菌,又称作绿非硫细菌,尽管还有一部分称作热微菌的细菌也属于绿非硫细菌。它们具有绿色的色素,包括作为反应中心的菌绿素a和
- 法医病理学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学法医病理学(英语:forensic pathology),病
- 双翅目双翅目(学名:Diptera)包括蚊、蝇、虻等昆虫,约有8.5万种,是昆虫纲中居于鞘翅目、鳞翅目和膜翅目之后的第四大目。除了在南极洲之外,在全世界都很普遍。其中某些种类是传播疾病给人
- 血管收缩剂血管收缩(vasoconstriction),亦即血管收窄,是指体内血管管腔收窄,这会造成血压的上升。它的相反过程称为血管舒张。血管收缩可以是由血管收缩剂造成。血管收缩剂是针对特定的受体
- 电磁辐射电磁波,又称电磁辐射,是指同相振荡,且互相垂直的电场与磁场,在空间中以波的形式传递能量和动量,其传播方向垂直于电场与磁场的振荡方向。电磁辐射的量子形式是光子。电磁波不需要
- 皮肤溃疡皮肤溃疡(英语:Skin Ulcer)指的是皮肤或者黏膜上出现的疮,并伴有组织脱落的迹象。皮肤溃疡可导致表皮完全脱落,此外真皮甚至皮下脂肪也时有部分脱落的情况。
- 梅第奇家族美第奇家族(意大利语:Medici,/ˈmɛdᵻtʃi/ MED-i-chee;意大利语发音:),或译为麦地奇家族、梅迪奇家族、梅迪契家族、梅第奇家族,是佛罗伦萨15世纪至18世纪中期在欧洲拥有强大势力
- 生锈生锈是指金属和空气中的氧,所产生氧化后的一种变化。一般所谓生锈是指其锈改变其物质原有型态与质感,如铁锈或碱式碳酸铜等。不过若只是生锈为金属氧化的话,大部分金属都会生锈
- 氦-2在物理学中,双质子,是指仅含有2个质子、不包含任何中子的核素,可以视为一种假想的氦同位素,因此又称为氦-2(Helium-2,2He)。一般认为双质子(或氦-2)无法稳定存在,是由于核力的自旋-自旋
- 多聚酶链式反应聚合酶链式反应(英文:Polymerase chain reaction,缩写:PCR,又称多聚酶链式反应),是一项利用DNA双链复制的原理,在生物体外复制特定DNA片段的核酸合成技术。通过这一技术,可在短时间内