手写识别

✍ dations ◷ 2025-10-29 01:41:14 #信息技术

手写识别(英语:Handwriting recognition)是计算机在纸、照片、触摸屏或其他设备中接收并识别人手写的文字等信息的技术,主要应用于光学字符识别(OCR)。

离线手写识别涉及到将图像中的文本自动转换成是计算机可以使用的字符代码。离线手写识别是比较困难的,因为不同的人有不同的书写风格。离线手写识别主要应用在打印出来的文字识别上。

常常使用缩小识别范围,例如邮政编码只包含1~9的数字,识别这种数字可以减少错误的可能。

主要的技术:

离线字符识别往往涉及扫描过去写的表格或文档。这意味着该设备或软件需要将扫描的图像中所包含的单个字符提取出来。然而,在这一步中有几种常见的缺陷。其中最常见的是将多个相连的字符当作为单个字符分离出来。这增加了识别的难度,但现在许多软件已经开始适应这种问题。

当单个字符的提取出来后,识别引擎开始计算其对应的计算机字符。现在有几种不同的识别技术。

除了人工神经网络外,程序员有时必须手动确定他们感觉很重要的属性。

这些属性可能是:

这种方法可以提高识别的准确性,但需要花费更多的研发时间。

在线手写识别可以分解为几个通用的步骤:

预处理的目的是摒弃无关的输入数据,可以减少负面的影响。这涉及到速度和准确性。通常由图像二值化、 正常化、 采样、 平滑、去噪预处理等组成。

早在20世纪80年代,就有人提出在商业产品中将手写体识别作为键盘输入的一种替代方式。

虽然公众已经习惯将手写识别看作一种输入方式,但在台式电脑或笔记本电脑中并没有得到广泛的使用。键盘仍被普遍认为是速度更快,更可靠的输入方式。截至2006年,许多掌上型电脑提供手写输入,但精确度仍是一个问题,有的人还认为屏幕键盘更有效率。

手写识别有活跃的社区和众多研究它的学者。现在较大的手写识别会议有“ICFHR”和“ICDAR”。

活跃的研究领域包括:

相关

  • 对乙酰氨基酚中毒对乙酰氨基酚中毒(英语:Paracetamol toxicity)由过量服用止痛药对乙酰氨基酚导致,主要导致肝损伤,对乙酰氨基酚也是全球主要的中毒原因之一。在美国和英国,其是导致急性肝衰竭的最
  • 热失神中暑(英语:Heat stroke)是一种受室外空气的高温多湿或阳光过久直接照射动物体、人体等造成体温异常升高不降所引起的症状的通称。从病情的差异大致上可分为以下四类:
  • Hsub2/subCSesub3/sub硒代碳酸是一种无机化合物,为碳酸中的氧被硒取代产生的化合物,其分子式为H2CSe3。用二硒化碳(CSe2)从金属的硒氢化物(HSe-)的水溶液或乙醇溶液沉淀出紫色的三硒代碳酸盐。通常
  • 汤斯县汤斯县(Towns County, Georgia)是美国乔治亚州北部的一个县,北邻北卡罗莱纳州。面积446平方公里。根据美国2000年人口普查,共有人口9,319人。县治海亚瓦夕 (Hiawassee)。成立于1
  • 腺瘤样瘤腺瘤样瘤(英语:Adenomatoid tumor),是一种原生的间皮性肿瘤。它一般出现于生殖道,比如睾丸和副睾。但是,它也发现于胰腺中。在妇科中,它也发现于子宫和输卵管里。
  • 伦敦政经学院Rerum cognoscere causas To know the causes of things (伦敦政治经济学院(英语:The London School of Economics and Political Science;缩写:LSE;简称:伦敦经济学院或伦敦政经
  • 独立市独立市或独立镇是指不隶属于多用途地方政府的城市或城镇。在神圣罗马帝国,以及其(某种程度上的)继承国德意志邦联和德意志帝国,所谓的“自由帝国城市”(free imperial cities,主格
  • 北韩改革放送北韩改革放送(韩语:북한개혁방송;英语:North Korea Reform Radio)是韩国对朝鲜的广播,播出时使用“朝鲜改革放送”(韩语:조선개혁방송)的名称。广播语言为朝鲜语,用短波广播。2007年12
  • 煎饼卷大葱煎饼卷大葱,又称杂粮煎饼、山东杂粮煎饼,是一种由煎饼,大葱,甜面酱制作而成的中式食品,它一方面代表的是山东的饮食,另一方面又代表了山东省地方文化。知名度相当高,是中国山东省的
  • 六叠字六叠字是指汉字中一类由六个完全相同的部分所组成的叠字。大多数的六叠字亦可以被视为两个三叠字或三个二叠字的组合。现将已知的此类字列于下表: