首页 >
光学字符识别
✍ dations ◷ 2025-12-04 02:06:32 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
相关
- 细胞核细胞核(拉丁语:nucleus)是存在于真核细胞中的封闭式膜状细胞器,内部含有细胞中大多数的遗传物质,也就是DNA。这些DNA与多种蛋白质(如组织蛋白)复合形成染色质。而染色质在细胞分裂
- 红细胞生成红细胞生成(英语:erythropoiesis)是指红细胞的生成过程。缺氧时,会促进肾脏产生促红细胞生成素。这种激素可以刺激红细胞前体细胞的增殖分化,并最终在造血组织中发育成为成熟的红
- 孤立语孤立语(Isolating language),是有低语素单词比(morpheme-per-word ratio)的语言。依照语言学家的定义分类标准不同,孤立语与分析语之间的关系可能会产生三种情况:相对于综合语(其中
- 中文输入技术中文输入技术是指将汉字输入计算机等电子设备的技术,它是中文信息处理技术的一个重要组成部分。
- 舔肛舔肛,又称舐肛,是口交的一种形式,指性行为中一方以口(唇、舌)接触另一方肛门以进行性刺激。此动作可由各种性取向的人群采行。在性服务场所,又称毒龙钻。舔肛的具体形式包括吻吸、
- 中元古代中元古代(英语:Mesoproterozoic,符号MP)是地质时代中的一个代,开始于同位素年龄1600百万年(Ma),结束于1000Ma。中元古代期间蓝藻、红藻、绿藻发育,出现大型宏观藻类。中元古代属于前
- 水手号计划水手号计划(英语:Mariner program,又译水手计划)是由美国太空总署所主导的太空探索计划。在此计划中发射了一系列为探索水星、金星和火星而设计的无人航天器。这个计划夺得多项
- 蓬蘽蓬蘽(学名:Rubus hirsutus)为蔷薇科悬钩子属的植物。分布在日本、朝鲜、台湾岛以及中国大陆的江西、福建、浙江、安徽、广东、河南、江苏等地,生长于海拔1,500米的地区,见于山坡
- 篝火之夜篝火之夜(英语:Bonfire Night),又称盖伊·福克斯之夜(Guy Fawkes Night)是指每年11月5日在英国举行的庆祝活动。按照传统习俗,当天人们会搭建篝火,燃放焰火,焚烧火药阴谋的策划者的假
- 甲醇经济甲醇经济(英语:methanol economy)是一种提议中未来的经济形式,使用甲醇来代替现在广泛使用的化石燃料来用作能量存储,地面交通燃料,以及合成碳氢化合物的原料及其产品。它与提议中
