文本自动校对技术

✍ dations ◷ 2025-06-08 16:02:42 #文本自动校对技术

文本自动校对属于自然语言处理的研究范畴,并具有广泛的应用价值。可用于个人书写文字的检查,也可满足出版业的大量校稿需求。文本自动校对,分为几种技术,一是文字自动校对,即程式将文本中出现的错字,借着文法检查器的检查,一一标出,由使用者用眼看逐一校对。二是语音自动校对,即让语音程式将文本转成语音输出,让校稿人员用听的,以发现错误。这种校对方式,属于比较弱的校对方式,更多的依赖于人的听觉与判断。因此,长期以来,文本自动校对以文字自动校对为主。

文本自动校对的发端甚早,1960年,IBM Thomas J. Watson研究中心便首先在IBM/360和IBM/370用UNIX实现了一个TYPO英文拼写检查器。成为文本自动校对的开端。1971年,斯坦福大学的Ralph Gorin也在DEC-10机上实现了一个英文拼写检查程序:SpellL。1980年代,自动校对成为文书处理软件的基本功能之一,苹果电脑以及微软Word的推出,使个人电脑开始具备文本自动校对的功能。

相关

  • 爱沙尼亚语爱沙尼亚语(eesti keel),中文也称爱沙尼亚文,是爱沙尼亚的国语,2012年约有120万人日常使用,属于乌拉尔语系的芬兰-乌戈尔语族,最接近芬兰语,这两种语言近似到可以相通的地步——至少
  • 葡萄花酸庚酸,结构式CH3(CH2)5COOH。无色具腐败脂肪气味的透明油状液体。微溶于水,溶于乙醇和乙醚。1-己烯与合成气经羰基化得到庚醛,后者再经空气氧化得到庚酸。用于生产庚酸酯类,用作
  • 安娜·卡列尼娜 (角色)安娜·阿尔卡季耶芙娜·卡列尼娜(俄语:Анна Аркадьевна Каренина)是列夫·托尔斯泰小说《安娜·卡列尼娜》的主角。葛丽泰·嘉宝、费雯·丽和绮拉·奈特
  • 宁要社会主义的草,不要资本主义的苗宁要社会主义的草,不要资本主义的苗是文革结束后批判的四人帮言论之一。类似的说法还有“宁要社会主义的低产,不要资本主义的高产”、“宁要社会主义的低速度,不要资本主义的高
  • 丹尼尔·夏弗朗丹尼尔·夏弗朗(俄语:Даниил Шафран,转写:Daniil Shafran,英文媒体常用的拼法:Daniel Shafran,1923年-1997年)是苏联及俄罗斯地位仅次于罗斯特罗波维奇的国际水准的大提
  • 大数假说大数假说是由保罗·狄拉克在1937年提出的一个假设。他比较了两个不带量纲的量值:基本作用力(在此为重力与电磁力)的比例与宇宙年龄的尺度,发现两者皆落在约40个数量级。狄拉克猜
  • 1990-91球季英格兰足总杯1990/91球季英格兰足总杯(英语:FA Cup),是第110届英格兰足总杯,今届赛事的冠军是热刺,他们在决赛以2:1 (加时)击败诺定咸森林,夺得冠军。热刺继1980-82球季两连霸后再次赢得冠军。
  • 横向道路不丹的横向道路始于西南边境的彭措林,终于东边的塔希冈,连接起来很多主要城市如通萨、旺杜波德朗、帕罗、延布和普那卡。横向道路通过了很多海拔较高的地点,像是特里莫拉(Tremo
  • 凯凯 (熊猫)凯凯,是中华人民共和国送交新加坡进行合作研究的两只大熊猫之一,雄性,原名武杰,生于四川雅安卧龙自然保护区的熊猫基地。2012年9月6日,凯凯与另一只大熊猫“嘉嘉”到达新加坡动物园,按照中新两国政府商定,“凯凯”和“嘉嘉”将在新加坡定居10年。中国于2012年赠送给新加坡的两只大熊猫——“凯凯”和“嘉嘉”的名字从新加坡举办的全国命名比赛的1000个提名中选出,分别代表“胜利”和“美丽”。这两个名字象征对新中友好关系日益增进的希望。凯凯绰号“洋葱头”,因为他的头上有一小撮多出来的毛。非常活泼,很有表演欲,经常
  • 李原 (1922年)李原(1922年6月-2015年3月14日),原名岳殿陞,曾用名岳克,男,山东平原人,中华人民共和国政治人物,曾任南开大学党委书记,天津市政协副主席,天津市人大常委会副主任。