OCR

✍ dations ◷ 2025-11-09 13:25:24 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。

相关

  • Spironolactone螺内酯(英语:spironolactone),商品名有安体舒通、Aldactone等,是一种常用于治疗心衰、肝硬化、胃病等引发的积液的利尿药。此药也用于治疗高血压、补充后仍无改善的低血钾,以及女
  • X连锁淋巴增生性疾病X连锁淋巴细胞增生性疾病(X-linked lymphoproliferative disease),又名邓肯病(Duncan's disease):86或珀蒂洛综合征(Purtilo syndrome),是一种淋巴增生性障碍(英语:lymphoproliferativ
  • 被取代的科学理论此条目列出曾获得广泛共识的理论及学说,但被现今科学认定为现实的不完全或错误的解读。因此伪科学和边绿科学等未曾获广泛共识的理论不算在内。另外也不包括李森科主义等部分
  • 苯二氮䓬类药物苯二氮䓬类药物(拉丁语:Benzodiazepines,BZDs、䓬/zhuó/),又译苯二氮平,是一种精神药物,其核心化学结构是一个苯环和一个䓬环。第一种此类药物是氯氮䓬(利眠宁),由Leo Sternbach在195
  • 安全期避孕法安全期是指女性的一种生理周期,是指女性不会受孕的期间,与月经有关系。若安全期估算准确,且月经周期没有变化,可以在不进行其他避孕措施的情形下,在安全期进行性行为,但女性只是怀
  • 休宁休宁县是中国安徽省黄山市下辖的一个县,位于安徽、江西、浙江三省交界处。休宁县是古徽州府一府六县之一,被誉为“中国第一状元县”。东汉建安十三年(208年)建休阳县,距今已有180
  • 萨维尔·勒·皮雄格扎维埃·勒皮雄(法语:Xavier Le Pichon, 1937年6月18日-),法国地质学家。在他的众多贡献中,最富盛名的是1968年提出的板块构造论的综合模型。他是法兰西学院的教授。勒皮雄教授
  • 埃米略·门德斯·佩雷斯埃米略·门德斯·佩雷斯(西班牙语:Emilio Méndez Pérez,1949年5月22日-)是西班牙物理学家。门德斯于1934年6月15日出生在西班牙加泰罗尼亚莱里达。毕业于马德里康普顿斯大学,后
  • 就业雇佣(英语:employment,意近:就业)是指二个伙伴之间的契约关系,其中一方为雇佣者(雇主、雇佣人),另一方为被雇佣者(雇员)。从法律意义来看,通过双方契约约定,“被雇佣者”为“雇佣者”工作
  • 迈克·约翰斯迈克尔·欧文·约翰斯(Michael Owen Johanns,1950年6月18日艾奥瓦州欧塞奇),美国政治家,美国共和党成员,曾任内布拉斯加州州长(1999年-2005年)、美国农业部长(2005年-2007年)。