手写识别

✍ dations ◷ 2025-05-18 04:54:16 #信息技术

手写识别(英语:Handwriting recognition)是计算机在纸、照片、触摸屏或其他设备中接收并识别人手写的文字等信息的技术,主要应用于光学字符识别(OCR)。

离线手写识别涉及到将图像中的文本自动转换成是计算机可以使用的字符代码。离线手写识别是比较困难的,因为不同的人有不同的书写风格。离线手写识别主要应用在打印出来的文字识别上。

常常使用缩小识别范围,例如邮政编码只包含1~9的数字,识别这种数字可以减少错误的可能。

主要的技术:

离线字符识别往往涉及扫描过去写的表格或文档。这意味着该设备或软件需要将扫描的图像中所包含的单个字符提取出来。然而,在这一步中有几种常见的缺陷。其中最常见的是将多个相连的字符当作为单个字符分离出来。这增加了识别的难度,但现在许多软件已经开始适应这种问题。

当单个字符的提取出来后,识别引擎开始计算其对应的计算机字符。现在有几种不同的识别技术。

除了人工神经网络外,程序员有时必须手动确定他们感觉很重要的属性。

这些属性可能是:

这种方法可以提高识别的准确性,但需要花费更多的研发时间。

在线手写识别可以分解为几个通用的步骤:

预处理的目的是摒弃无关的输入数据,可以减少负面的影响。这涉及到速度和准确性。通常由图像二值化、 正常化、 采样、 平滑、去噪预处理等组成。

早在20世纪80年代,就有人提出在商业产品中将手写体识别作为键盘输入的一种替代方式。

虽然公众已经习惯将手写识别看作一种输入方式,但在台式电脑或笔记本电脑中并没有得到广泛的使用。键盘仍被普遍认为是速度更快,更可靠的输入方式。截至2006年,许多掌上型电脑提供手写输入,但精确度仍是一个问题,有的人还认为屏幕键盘更有效率。

手写识别有活跃的社区和众多研究它的学者。现在较大的手写识别会议有“ICFHR”和“ICDAR”。

活跃的研究领域包括:

相关

  • 医学征象医学征象(英语:Medical sign),(卫生福利部编码指引翻译为:征候),又称体征、病征,医学术语,指在进行身体检查或病理检查时,能够提供医生对医疗进展及疾病状况的迹象及指标,通常是可客观
  • 糖基化糖基化(英语:Glycosylation)是在酶的控制下, 蛋白质或脂质附加上糖类的过程。此过程为四种共转译(co-translational)与后转译修饰的的一种形式,发生于高基氏体。蛋白质经过糖基化
  • 权威性权威(英语:Authority),可以最简单地定义为“正当的权力”。权力是影响他人行为的能力,而权威则是发挥此影响的权利。人类社会中某种不容置疑的,强制性力量,要求人们无条件的遵从。
  • 施特恩-格拉赫实验施特恩-格拉赫实验是德国物理学家奥托·施特恩和瓦尔特·格拉赫为证实原子角动量量子化于1921年到1922年期间完成的一个著名实验。如图所示,施特恩-格拉赫实验设法令高温的银
  • 双重间谍双重间谍,泛指表面上受聘于某一情报机构,但实际上为另一机构办事,作反情报工作的间谍。双重间谍的概念在中国早于春秋战国时代已经有所记载,现代的双重间谍工作范畴围绕夺取目标
  • 吉福德·平肖吉福德·平肖国家森林(英语:Gifford Pinchot National Forest)是座美国国家森林,位于美国华盛顿州南部,由美国国家森林局管辖。森林面积1.32 × 106英亩(5,300平方千米),沿着喀斯喀
  • 铜鼓铜鼓(壮语:皷銅 gyongdoengz,又作鈨 nyenz;越南语:trống đồng/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM
  • 扶余扶余可以指:
  • 乌江乌江为长江上游南岸最大支流,也是流经贵州省的最大河流。于重庆市涪陵区汇入长江,全长1037千米(其中贵州境内889千米),流域总面积为115747平方千米(其中贵州境内66807平方千米)。乌
  • 明水组明水组是位于中国黑龙江绥化市一带以及吉林、内蒙古的上白垩世地层,1960年由松辽石油勘探局综合研究大队命名。该地层以灰棕、灰白、灰黑色泥岩、粉砂质泥岩、粉砂岩(上部),灰绿