首页 >
光学字符识别
✍ dations ◷ 2025-07-12 11:47:04 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
相关
- 胆管胆管为胆汁由肝脏传送至十二指肠的一个管道。肝内的胆小管逐级合并成左、右肝管,出肝门再合成为肝总管;肝总管与胆囊管汇合成胆总管。肝细胞持续不断的制造胆汁浓缩并储存于胆
- 纤溶酶1B2I, 1BML, 1BUI, 1CEA, 1CEB, 1DDJ, 1HPJ, 1HPK, 1I5K, 1KI0, 1KRN, 1L4D, 1L4Z, 1PK4, 1PKR, 1PMK, 1QRZ, 1RJX, 2DOH, 2DOI, 2KNF, 2L0S, 2PK4, 3UIR, 4A5T, 4DCB, 4DUR
- 头昏目眩头重脚轻(Lightheadedness)也称为头昏目眩,是头晕时常见,令人不悦的感觉,常伴随着可能会昏倒的感觉。头重脚轻的感觉可能是短期或长期的,偶尔也可能是慢性病。当时也可能会出现所
- 空穴现象空穴现象(Cavitation),又译气穴现象、气蚀现象或空洞现象,指的是在流动的液体中气相的空穴 – 亦即极小的无液体空间(“气泡”或“空隙”) – 产生与消灭的一种物理现象,是力作用在
- 线粒体核糖体线粒体核糖体是存在于真核细胞线粒体内的一种核糖体,负责完成线粒体这种细胞器中进行的翻译过程。线粒体核糖体的沉降系数介干55S-56S之间,是已发现的沉降系数最小的核糖体。
- 特伦托自治省特伦托自治省(Provincia autonoma di Trento)是意大利特伦蒂诺-上阿迪杰的一个省。面积6,207平方公里,2005年人口504,824人。首府特伦托。下分223市镇。
- 贝克岛贝克岛(英语:Baker Island)是一座位于中太平洋赤道稍北的环礁,大约在檀香山西南3100千米(1675海里),夏威夷至澳大利亚的半程,面积1.18平方千米。 贝克岛是美国的无建制领地,无人居住,
- 南威尔士南威尔士(英语:South Wales,威尔士语:De Cymru)是威尔士南部的一个地区名,在东部和南部与威尔士及布里斯托相邻。南威尔士也是英国西南部人口最为稠密的地区,有220万人生活在这里。
- 莱顿弗罗斯特现象莱顿弗罗斯特现象,又译作李登弗斯特作用、赖登福现象,在1732年为赫尔曼·布尔哈夫(Herman Boerhaave)首次发现,其后在1756年,德国医生约翰·戈特洛布·莱顿弗罗斯特(英语:Johann Got
- 维吉尼亚州弗吉尼亚州,正式名称为弗吉尼亚联邦(英语:Commonwealth of Virginia),是美国东部的一个州,美国开国时十三州之一。维珍尼亚州域范围位于北纬36°31'至39°37',西经75°13'至83°37'