日文输入法

✍ dations ◷ 2025-06-23 08:23:41 #日文输入法

日文输入法(日语:日本語入力システム),是指为了将日语输入电脑或移动电话等装置而采用的编码方法。在电脑中,英语等语言的输入只需要像打字机时代那样直接敲键盘就可以了,但是像日语这样常用文字的数目达到数千的语言,输入时不可能给每一个文字都分配一个按键,因此需要透过各种方式将文字编码为能够用简便输入。这样的编码系统就是日文输入法。

日文输入法在DOS时代都是透过前端处理器(Front End Processor)实现的,因此当时往往被称作日语输入前端处理器(日本語入力FEP,乃至于简称为FEP)。在Windows普及后则往往被称作IME(Input Method Editor)。

在日语中,IME既可以泛指一切输入法,也可能专指微软日语输入法Microsoft IME,但本文中不用IME专指微软日语输入法。而“入力”则泛指一切的输入形式,如:输入功率等。

另外,日语中专指文字输入法的用语是“言語入力”。

使用为美式英语设计的标准的QWERTY键盘就可以输入日语。由于QWERTY键盘上并没有铭刻假名,所以其使用者往往使用罗马字输入法。但非JIS键盘也可以使用假名输入的方法输入日语,键位排列与JIS规格键盘稍有区别(“ろ”和“む”的位置不同)

JIS键盘有而QWERTY键盘没有的按钮,可以通过按下其他组合键来模拟(例如:Ctrl+Caps Lock切换为平假名,Alt+Caps Lock切换为片假名)。

一般来说,由于只要掌握了日语罗马字的拼法就可以使用罗马字输入法,而直接输入假名则需要记忆假名在键盘上的位置;尽管许多人使用附有假名的日语键盘,大多数人仍是靠罗马字的方式输入。输入法的罗马字与一般的有所不同,例如习惯上平文式罗马字的“ぢ”及“じ”均为ji,而输入法的前者则为di;输入“でぃ”时默认需输入dhi。输入法的“ん”需输入nn;输入小字时,在其前加上 l 或 x ,如 la 和 xa 可显示“ぁ”,xtu, xtsu, ltu, ltsu 可显示“っ”。

KB Japanese.svg

日本工业规格(JIS)对日文键盘上假名的排放位置作了规定。在日本销售的键盘,大部分都是QWERTY键盘或者JIS键盘。Q W E R T Y在日文键盘对应着以下假名:た て い す か ん(Ta Te I Su Ka N')

注意:标准的QWERTY键盘和JIS键盘的标点符号按键不同。例如QWERTY键盘上Shift+2是“@”,JIS键盘上却是“"”。

标记着假名的日文键盘在日本以外的市场颇为罕见,但直接输入平假名并没有任何的硬件限制。通常只需要直接切换到日文键盘序列并切换到假名模式即可直接输入平假名(也可以基于这个键盘序列通过输入法转换某些词语到日语汉字),大部分新型的操作系统都有支援这个功能。

因为日语输入是基于平假名的,输入完整的日语还需要转换汉字、片假名以及普通的英语字符、标点符号,所以日文键盘上会多几个特殊按钮,使空白键短了许多,令初学者需要一定时间才能习惯。

拇指上档式(親指シフト)是直接输入假名的键盘布局。后来做过一些更改后又称作NICOLA(ニコラ)式。两者统称为拇指上档键盘。

和JIS键盘最大的不同在于把QWERTY键盘放置空格的地方改为了两个“拇指上档键”,而空格自身变成了一个和Alt/Ctrl差不多大小的按键。这样做使得可以很容易地按上档键切换假名,而日语输入不像英语那样需要用空格隔开单词,不会因为空格难按影响输入。拇指上档式把输入假名的按键控制在3栏,而非JIS键盘的4栏。

21世纪以来,JIS键盘成了日语输入时最常使用的键盘,拇指上档键盘相比于JIS键盘处于完全不利的地位。但是由于使用者可以使用模拟程序在JIS键盘上实现拇指上档键盘的效果,拇指上档键盘的销量不能直接反映使用拇指上档式键盘布局的人数。

在公共设施和银行ATM、自动导航仪上可以看到的键盘布局。将假名按照五十音图的顺序排列在键盘上。

在个人文字处理器刚刚出现的时代,许多公司发售过以50音顺排列的打字机。

移动电话的按键较电脑少,所以必须另外研发出一套完全不同的输入方法。

移动电话中的日语输入基于移动电话上的数字按钮。如图中的键盘,每个数字都对应一行假名,例4键对应た行假名,这行假名包括有た ち つ て と っ,重复按4可选取想要的字。0除了对应わ行假名,还用作处理浊音和半浊音( ゙ ゚符号)以及拨音ん。小写假名以及促音与普通假名的输入方法相同(重复按键)。假名输入完毕按屏幕上提示操作以将某些字转换成想要的词语。

智能手机除了使用普通手机键盘的方式输入之外,还能使用触控输入(フリック入力)。首先,各行あ段假名排成一个类似电脑键盘最右侧数字键的布局,其他4段假名按十字形或者扇形排列あ段周围。在按下某个あ段假名后手指不放并向对应方向移动,则可输入相应的假名。

日文输入法可分为汉字直接输入(汉字直接入力)和假名汉字转换(かな汉字変换)两大类。其中汉字直接输入又可分为联想式和非联想式,假名汉字转换又可分为通过输入罗马字来转换成平假名或直接输入平假名。假名汉字转换是在1978年9月26日发售的东芝JW-10中最初实现的。

绝大多数日语使用者使用的都是假名汉字转换输入法。由于在假名汉字转换输入法中,直接输入平假名需要先记忆平假名的键盘分布,所以罗马字输入法也不乏使用者。也有部分软件采用GUI选字方式甚至支援手写模式作为辅助。

汉字直接输入,在日本往往被简称作“汉直”。由于汉直不是靠先输入日语的读音再由机器转换为对应的汉字,而是直接输入汉字或假名、符号对应的代码,因而可以做到一字一码,不会产生假名汉字转换所出现的选词选错导致的错别字。熟练者可以做到不看屏幕盲打。但是,打字者无法输入自己不知道编码的汉字。

在被称作Mainframe的大型机刚刚能够处理日语的时候(1970~1980年代早期),电脑还没有假名汉字转换的功能,内存容量也很少(那个时代即使是超大型机也只有256MB内存、几十GB的硬盘),因此曾使用过巨型键盘直接输入汉字(在一个键上分配数个汉字)、用数字键输入汉字的机内码或者JIS区位码的汉字直接输入法。

现在的汉字直接输入可分为联想式和非联想式,不论那种都是一字一码。

编码和所输入的汉字有关。

编码和所输入的汉字无关。

假名汉字转换的典型动作方式如下:首先,用户将想输入的文字的读音通过输入装置输入。使用键盘输入时有假名输入和罗马字输入的区别。假名汉字转换系统读取读音,通过语素解析(Text segmentation)和“读音与汉字的对照表”(也就是所谓的辞典)转换为汉字假名混写文。

通过敲击键盘,输入键盘上所铭刻的文字中的日文的那一部分所对应的假名。例如日本常见的JIS键盘,按键后输入键的右侧铭刻的假名。假名输入(かな入力)存在不同的键盘布局。有些键盘布局只有特定的输入法才能使用,例如anthy可以使用拇指上档式输入(即使不是拇指上档式键盘也可用其他键模拟),而Google的mozc则不可。另外,在GNU/Linux中键盘布局与输入法分离,如果不使用JIS键盘布局而使用直接输入假名的输入法,就会发现一部分按键顺序与Windows输入法不同。

日本工业规格JIS X 4063:2000(仮名漢字変換システムのための英字キー入力から仮名への変換方式,中译:为汉字假名转换系统而设的英语输入转换为假名的转换方式)曾经是一个日语罗马字输入(ローマ字入力)的标准,但是该标准已于2010年1月20日废止。

将和读音对应的罗马字输入后,罗马字会被转换为假名显示在屏幕上。之后进行的假名汉字转换通常与本阶段分离,成为另一个阶段。

增强型罗马字方案类似汉语拼音输入法的双拼方案。都是使用键盘上的辅音和其他按键来代表元音组合,从而达到节省按键次数的方法。

一个增强型罗马字方案(类似汉语拼音的双拼)

这里用一个例子解释。这个键盘上除了aeiou和y以外,每个按键下都写有对应的“韵母(?)”。像chuuka即可拆分为“c+yuu k+a”,而yuu对应c,也就编码成了“ccka”。jinmin拆分为为“j+in m+in”,in对应n,所以编码成了“jnmn”。而像“央(ou)”字这样的零“声母(?)”则使用“l”代表声母,因为日语没有l开头的发音。

「中華人民共和国中央人民政府、今日成立しました」这句话的标准罗马字输入(类似全拼)需要60次按键。使用增强型罗马字(类似双拼)则只需要42次按键。直接输入假名如果是JIS键盘,则是41次按键外加6次上档键。但是这个例子中为了实现双拼,「ん」和「っ」就无法再用标准罗马字输入了,而是使用“q”输入「ん」,“;”输入「っ」。

M式键盘是森田正典于1980年代所提出的增强型罗马字方案。该键盘布局使用了和拇指上档键盘类似的拇指上档键。虽然得到了许多专业人士的极高评价,但是并未得到大的普及。以后的许多增强型罗马字输入方案的思考方式都可以说类似于M式键盘的处理模式。

日语维基百科上有许多增强型罗马字方案,例如:AZIK、Km式ローマ字配列、チーズタイピング。

富士通的网站做了一个不同输入方式速度的比较。输入700字左右的朝日新闻的“天声人语”文章,结果如下:

看来尽管标准罗马字输入的按键量是JIS假名输入按键的近1.5倍,但是JIS假名输入的效率才是标准罗马字输入的近1.3倍。

用户直接或间接输入假名序列(未转换文字列),按下“変換”键之后输入法开始判断进行分词,并开始汉字转换。许多输入法软件拥有包括熟语在内横跨多个文节的用例数据库,能够根据前后文节不同将读音转换成合适的汉字。一部分输入法中,未转换文字列积攒了很多假名之后会自动开始转换,或者是在输入了标点符号后自动转换标点之前的内容。

转换结果符合要求,则直接按确定键将结果转交给其他应用程序。当转换结果不是预期的转换结果时,用户可分别选择每一文节的转换结果,或者改变文节间的切分。当然,如果不用进行选字,默认的转换结果就是对的,那当然是最好的了。转换精度的优劣是决定输入法性能的决定性因素之一。

各输入法收入有假名汉字转换用的词汇数据库(日语称之为“系统辞典”,和“用户辞典”相对)。在汉字之外也收录有符号/特殊文字、英语单词、表情符号、方言词汇、网络语言等等,有的输入法利用转换系统,实现了邮政编码转换为地名、翻译、计算等功能。

在许多输入法中,用户可以将自己需要的词汇加入到用户辞典里去。输入法自动学习功能强大、系统自带辞典丰富的话,可以减少自定义词汇的工作量。有的输入法可以把某个不需要却常常出现在转换结果候选的里的词通过设置屏蔽。

通过用户的转换、选字的结果增加未来的转换精度。通过自动学习,输入法可以更加切合个人的需要,但是有时错误的选字结果也被学习了,下次选字时就会出现在前面给人带来麻烦。ATOK等等可以直接编辑转换历史记录删除不要的转换结果。

有时学习数量过多,反而降低了转换精度,或使得学习功能异常(参见Microsoft IME)。此时需要重新初始化输入法的学习结果。

减少输入字数的输入预测(入力予测)功能,在和电脑相比输入速度慢的手机系统上得到了发展。之后,在2000年代后期,ATOK和Google日文输入法等电脑用的输入法中也加入了输入预测功能。Google日文输入法的预测功能使用的是从Google搜索系统中得来的数据,和手机系统的输入预测的工作方式不同。

有的输入法为帮助用户正确选择同音词,会在选字时出现解说同音词意思、用法的弹出窗口。

有的能够打字很快的用户会觉得,如果使用输入预测,则需要在预测列表中一一选择自己需要的词,反而降低了打字速度,因此辅助功能对他们是多余的。此外选字时弹出的解说词义窗口有时会影响程序的反应速度。因此许多输入法中的输入辅助功能是可以选择不使用的。

相关

  • 西佛兰德西佛兰德省(荷兰语:Provincie West-Vlaanderen)是位于比利时(弗拉芒大区,弗拉芒社群)西部的一个省,首府布鲁日,人口1,178,996(2015年),面积3,144.3平方公里。安特卫普省 · 东佛兰德省
  • ZigBeeZigBee,也称紫蜂,是一种低速短距离传输的无线网络协议,底层是采用IEEE 802.15.4标准规范的媒体访问层与物理层。主要特色有低速、低耗电、低成本、支持大量网络节点、支持多种
  • 26宪法正文I ∙ II ∙ III ∙ IV ∙ V ∙ VI ∙ VII其它修正案 XI ∙ XII ∙ XIII ∙ XIV ∙ XV XVI ∙ XVII ∙ XVIII ∙ XIX ∙ XX XXI ∙ XXII ∙ XXIII ∙
  • 公式在科学中,公式是一种把资讯准确地以符号表达的方法,就像是数学公式或化学式那样。在数学中,广义上的公式是指在特定的形式文法下,把数学符号组合而成之结果。在现代化学中,一个化
  • 安仁县第一中学坐标:26°42′28″N 113°16′17″E / 26.707682°N 113.27136°E / 26.707682; 113.27136安仁县第一中学(英语:No.1 Meddle School Anren County)位于湖南省郴州市安仁县城关镇
  • 玉城丹尼玉城康裕(玉城康裕/たまき やすひろ  ?),日本政治人物、前艺人,自由党干事长,2009年至2018年担任众议院议员。2018年冲绳县知事选举(日语:2018年沖縄県知事選挙)中,成功当选冲绳县知
  • 在线考试在线考试是指通过局域网、城域网进行考试的一种考试形式,也可以说成是通过网络媒体进行的考试。  
  • 洛倫扎·伊佐萝兰莎·伊柔(英语:Lorenza Izzo,1989年9月19日-)是一名智利知名女演员及模特儿。她曾于多部著名恐怖片出演过(大部分皆由其前夫艾利·罗斯执导),例如《劫后余生》、《当辣妹来敲门
  • 程应旄程应旄(生卒年不详),字郊倩,安徽新安人,清初医家,是《伤寒论》重要的注解者之一。他赞同方有执的“错简重订说”,主张宋版《伤寒论》条目已有错乱,应重加考订。提出以“表里脏腑”来
  • 托特·拉约什托特·拉约什(匈牙利语:Tóth Lajos,1914年8月25日-1984年8月24日),匈牙利男子竞技体操运动员。他曾获得1948年夏季奥运会体操比赛男子团体全能铜牌。他也参加了1936年和1952年夏