手写识别

✍ dations ◷ 2025-06-08 01:44:22 #信息技术

手写识别(英语:Handwriting recognition)是计算机在纸、照片、触摸屏或其他设备中接收并识别人手写的文字等信息的技术,主要应用于光学字符识别(OCR)。

离线手写识别涉及到将图像中的文本自动转换成是计算机可以使用的字符代码。离线手写识别是比较困难的,因为不同的人有不同的书写风格。离线手写识别主要应用在打印出来的文字识别上。

常常使用缩小识别范围,例如邮政编码只包含1~9的数字,识别这种数字可以减少错误的可能。

主要的技术:

离线字符识别往往涉及扫描过去写的表格或文档。这意味着该设备或软件需要将扫描的图像中所包含的单个字符提取出来。然而,在这一步中有几种常见的缺陷。其中最常见的是将多个相连的字符当作为单个字符分离出来。这增加了识别的难度,但现在许多软件已经开始适应这种问题。

当单个字符的提取出来后,识别引擎开始计算其对应的计算机字符。现在有几种不同的识别技术。

除了人工神经网络外,程序员有时必须手动确定他们感觉很重要的属性。

这些属性可能是:

这种方法可以提高识别的准确性,但需要花费更多的研发时间。

在线手写识别可以分解为几个通用的步骤:

预处理的目的是摒弃无关的输入数据,可以减少负面的影响。这涉及到速度和准确性。通常由图像二值化、 正常化、 采样、 平滑、去噪预处理等组成。

早在20世纪80年代,就有人提出在商业产品中将手写体识别作为键盘输入的一种替代方式。

虽然公众已经习惯将手写识别看作一种输入方式,但在台式电脑或笔记本电脑中并没有得到广泛的使用。键盘仍被普遍认为是速度更快,更可靠的输入方式。截至2006年,许多掌上型电脑提供手写输入,但精确度仍是一个问题,有的人还认为屏幕键盘更有效率。

手写识别有活跃的社区和众多研究它的学者。现在较大的手写识别会议有“ICFHR”和“ICDAR”。

活跃的研究领域包括:

相关

  • 微芯片集成电路(英语:integrated circuit,缩写作 IC;德语:integrierter Schaltkreis),或称微电路(microcircuit)、微芯片(microchip)、芯片(chip)在电子学中是一种将电路(主要包括半导体设备,也包
  • 责任医疗事故(英语:medical malpractice;也称为医疗失当或医疗疏失),是一法律诉讼原因,泛指医疗院所与医疗从业人员,在对病患提供医疗服务时,出现不当或怠忽的专业医疗行为过失(失当行为),
  • 债务陷阱外交债务陷阱外交(Debt-trap diplomacy)是一种以债务为基础的双边外交关系(英语:Bilateralism)。其作法为债权国刻意的向另一国提出大量的货款,在债务国无法履行债务义务(多半是资产货
  • 费尔德山国家公园费尔德山国家公园(Mount Field National Park)是澳大利亚塔斯马尼亚的一座国家公园,位于霍巴特西北方向64公里。景观多样化,从桉树温带雨林到高山沼泽,其最高点为海拔1,434米的费
  • 太阳高度太阳高度角(英语:solar zenith angle),也称太阳高度,是指某地的太阳光线与当地地平面的所交的最小线面角,这是以太阳视盘面的几何中心和理想地平线所夹的角度。太阳高度角可以使用
  • 环形数学中,环形(annulus)是一个环状的几何图形,或者更一般地,一个环状的对象。几何学中通常所说的环形就是圆环,一个大圆盘挖去一个小同心圆盘剩下的部分。圆环的对称性非常强,是一个
  • 郑廷玉郑廷玉又作庭玉,元代彰德(今河南安阳市)人。戏曲作家。生平不详,朱权《太和正音谱》评其词“如佩玉鸣銮”,《录鬼簿》列之于关汉卿、高文秀之后。有杂剧二十三种,郑廷玉艺术功力深
  • 递推关系式在数学上,递推关系(recurrence relation),也就是差分方程(difference equation),是一种递推地定义一个序列的方程:序列的每一项目是定义为前一项的函数。像户口调查映射(logistic map
  • 南方古猿源泉种南方古猿源泉种()是一个建议中的南方古猿种,根据其化石遗骇,可追溯至大约178万到195万年前的更新世。南方古猿源泉种的特色是:他同时具有原始人及现代人的特征,被认为更接近今日的
  • 贝磊勾斯特在托尔金(J. R. R. Tolkien)的小说里,贝磊勾斯特(Belegost)是伊瑞德隆(Ered Luin)两个矮人聚居地的其中一个。贝磊勾斯特在辛达林语中解作“巨大的要塞”。矮人以矮人语(Khuzdul)称为