日文输入法

✍ dations ◷ 2025-08-21 02:45:10 #日文输入法

日文输入法(日语:日本語入力システム),是指为了将日语输入电脑或移动电话等装置而采用的编码方法。在电脑中,英语等语言的输入只需要像打字机时代那样直接敲键盘就可以了,但是像日语这样常用文字的数目达到数千的语言,输入时不可能给每一个文字都分配一个按键,因此需要透过各种方式将文字编码为能够用简便输入。这样的编码系统就是日文输入法。

日文输入法在DOS时代都是透过前端处理器(Front End Processor)实现的,因此当时往往被称作日语输入前端处理器(日本語入力FEP,乃至于简称为FEP)。在Windows普及后则往往被称作IME(Input Method Editor)。

在日语中,IME既可以泛指一切输入法,也可能专指微软日语输入法Microsoft IME,但本文中不用IME专指微软日语输入法。而“入力”则泛指一切的输入形式,如:输入功率等。

另外,日语中专指文字输入法的用语是“言語入力”。

使用为美式英语设计的标准的QWERTY键盘就可以输入日语。由于QWERTY键盘上并没有铭刻假名,所以其使用者往往使用罗马字输入法。但非JIS键盘也可以使用假名输入的方法输入日语,键位排列与JIS规格键盘稍有区别(“ろ”和“む”的位置不同)

JIS键盘有而QWERTY键盘没有的按钮,可以通过按下其他组合键来模拟(例如:Ctrl+Caps Lock切换为平假名,Alt+Caps Lock切换为片假名)。

一般来说,由于只要掌握了日语罗马字的拼法就可以使用罗马字输入法,而直接输入假名则需要记忆假名在键盘上的位置;尽管许多人使用附有假名的日语键盘,大多数人仍是靠罗马字的方式输入。输入法的罗马字与一般的有所不同,例如习惯上平文式罗马字的“ぢ”及“じ”均为ji,而输入法的前者则为di;输入“でぃ”时默认需输入dhi。输入法的“ん”需输入nn;输入小字时,在其前加上 l 或 x ,如 la 和 xa 可显示“ぁ”,xtu, xtsu, ltu, ltsu 可显示“っ”。

KB Japanese.svg

日本工业规格(JIS)对日文键盘上假名的排放位置作了规定。在日本销售的键盘,大部分都是QWERTY键盘或者JIS键盘。Q W E R T Y在日文键盘对应着以下假名:た て い す か ん(Ta Te I Su Ka N')

注意:标准的QWERTY键盘和JIS键盘的标点符号按键不同。例如QWERTY键盘上Shift+2是“@”,JIS键盘上却是“"”。

标记着假名的日文键盘在日本以外的市场颇为罕见,但直接输入平假名并没有任何的硬件限制。通常只需要直接切换到日文键盘序列并切换到假名模式即可直接输入平假名(也可以基于这个键盘序列通过输入法转换某些词语到日语汉字),大部分新型的操作系统都有支援这个功能。

因为日语输入是基于平假名的,输入完整的日语还需要转换汉字、片假名以及普通的英语字符、标点符号,所以日文键盘上会多几个特殊按钮,使空白键短了许多,令初学者需要一定时间才能习惯。

拇指上档式(親指シフト)是直接输入假名的键盘布局。后来做过一些更改后又称作NICOLA(ニコラ)式。两者统称为拇指上档键盘。

和JIS键盘最大的不同在于把QWERTY键盘放置空格的地方改为了两个“拇指上档键”,而空格自身变成了一个和Alt/Ctrl差不多大小的按键。这样做使得可以很容易地按上档键切换假名,而日语输入不像英语那样需要用空格隔开单词,不会因为空格难按影响输入。拇指上档式把输入假名的按键控制在3栏,而非JIS键盘的4栏。

21世纪以来,JIS键盘成了日语输入时最常使用的键盘,拇指上档键盘相比于JIS键盘处于完全不利的地位。但是由于使用者可以使用模拟程序在JIS键盘上实现拇指上档键盘的效果,拇指上档键盘的销量不能直接反映使用拇指上档式键盘布局的人数。

在公共设施和银行ATM、自动导航仪上可以看到的键盘布局。将假名按照五十音图的顺序排列在键盘上。

在个人文字处理器刚刚出现的时代,许多公司发售过以50音顺排列的打字机。

移动电话的按键较电脑少,所以必须另外研发出一套完全不同的输入方法。

移动电话中的日语输入基于移动电话上的数字按钮。如图中的键盘,每个数字都对应一行假名,例4键对应た行假名,这行假名包括有た ち つ て と っ,重复按4可选取想要的字。0除了对应わ行假名,还用作处理浊音和半浊音( ゙ ゚符号)以及拨音ん。小写假名以及促音与普通假名的输入方法相同(重复按键)。假名输入完毕按屏幕上提示操作以将某些字转换成想要的词语。

智能手机除了使用普通手机键盘的方式输入之外,还能使用触控输入(フリック入力)。首先,各行あ段假名排成一个类似电脑键盘最右侧数字键的布局,其他4段假名按十字形或者扇形排列あ段周围。在按下某个あ段假名后手指不放并向对应方向移动,则可输入相应的假名。

日文输入法可分为汉字直接输入(汉字直接入力)和假名汉字转换(かな汉字変换)两大类。其中汉字直接输入又可分为联想式和非联想式,假名汉字转换又可分为通过输入罗马字来转换成平假名或直接输入平假名。假名汉字转换是在1978年9月26日发售的东芝JW-10中最初实现的。

绝大多数日语使用者使用的都是假名汉字转换输入法。由于在假名汉字转换输入法中,直接输入平假名需要先记忆平假名的键盘分布,所以罗马字输入法也不乏使用者。也有部分软件采用GUI选字方式甚至支援手写模式作为辅助。

汉字直接输入,在日本往往被简称作“汉直”。由于汉直不是靠先输入日语的读音再由机器转换为对应的汉字,而是直接输入汉字或假名、符号对应的代码,因而可以做到一字一码,不会产生假名汉字转换所出现的选词选错导致的错别字。熟练者可以做到不看屏幕盲打。但是,打字者无法输入自己不知道编码的汉字。

在被称作Mainframe的大型机刚刚能够处理日语的时候(1970~1980年代早期),电脑还没有假名汉字转换的功能,内存容量也很少(那个时代即使是超大型机也只有256MB内存、几十GB的硬盘),因此曾使用过巨型键盘直接输入汉字(在一个键上分配数个汉字)、用数字键输入汉字的机内码或者JIS区位码的汉字直接输入法。

现在的汉字直接输入可分为联想式和非联想式,不论那种都是一字一码。

编码和所输入的汉字有关。

编码和所输入的汉字无关。

假名汉字转换的典型动作方式如下:首先,用户将想输入的文字的读音通过输入装置输入。使用键盘输入时有假名输入和罗马字输入的区别。假名汉字转换系统读取读音,通过语素解析(Text segmentation)和“读音与汉字的对照表”(也就是所谓的辞典)转换为汉字假名混写文。

通过敲击键盘,输入键盘上所铭刻的文字中的日文的那一部分所对应的假名。例如日本常见的JIS键盘,按键后输入键的右侧铭刻的假名。假名输入(かな入力)存在不同的键盘布局。有些键盘布局只有特定的输入法才能使用,例如anthy可以使用拇指上档式输入(即使不是拇指上档式键盘也可用其他键模拟),而Google的mozc则不可。另外,在GNU/Linux中键盘布局与输入法分离,如果不使用JIS键盘布局而使用直接输入假名的输入法,就会发现一部分按键顺序与Windows输入法不同。

日本工业规格JIS X 4063:2000(仮名漢字変換システムのための英字キー入力から仮名への変換方式,中译:为汉字假名转换系统而设的英语输入转换为假名的转换方式)曾经是一个日语罗马字输入(ローマ字入力)的标准,但是该标准已于2010年1月20日废止。

将和读音对应的罗马字输入后,罗马字会被转换为假名显示在屏幕上。之后进行的假名汉字转换通常与本阶段分离,成为另一个阶段。

增强型罗马字方案类似汉语拼音输入法的双拼方案。都是使用键盘上的辅音和其他按键来代表元音组合,从而达到节省按键次数的方法。

一个增强型罗马字方案(类似汉语拼音的双拼)

这里用一个例子解释。这个键盘上除了aeiou和y以外,每个按键下都写有对应的“韵母(?)”。像chuuka即可拆分为“c+yuu k+a”,而yuu对应c,也就编码成了“ccka”。jinmin拆分为为“j+in m+in”,in对应n,所以编码成了“jnmn”。而像“央(ou)”字这样的零“声母(?)”则使用“l”代表声母,因为日语没有l开头的发音。

「中華人民共和国中央人民政府、今日成立しました」这句话的标准罗马字输入(类似全拼)需要60次按键。使用增强型罗马字(类似双拼)则只需要42次按键。直接输入假名如果是JIS键盘,则是41次按键外加6次上档键。但是这个例子中为了实现双拼,「ん」和「っ」就无法再用标准罗马字输入了,而是使用“q”输入「ん」,“;”输入「っ」。

M式键盘是森田正典于1980年代所提出的增强型罗马字方案。该键盘布局使用了和拇指上档键盘类似的拇指上档键。虽然得到了许多专业人士的极高评价,但是并未得到大的普及。以后的许多增强型罗马字输入方案的思考方式都可以说类似于M式键盘的处理模式。

日语维基百科上有许多增强型罗马字方案,例如:AZIK、Km式ローマ字配列、チーズタイピング。

富士通的网站做了一个不同输入方式速度的比较。输入700字左右的朝日新闻的“天声人语”文章,结果如下:

看来尽管标准罗马字输入的按键量是JIS假名输入按键的近1.5倍,但是JIS假名输入的效率才是标准罗马字输入的近1.3倍。

用户直接或间接输入假名序列(未转换文字列),按下“変換”键之后输入法开始判断进行分词,并开始汉字转换。许多输入法软件拥有包括熟语在内横跨多个文节的用例数据库,能够根据前后文节不同将读音转换成合适的汉字。一部分输入法中,未转换文字列积攒了很多假名之后会自动开始转换,或者是在输入了标点符号后自动转换标点之前的内容。

转换结果符合要求,则直接按确定键将结果转交给其他应用程序。当转换结果不是预期的转换结果时,用户可分别选择每一文节的转换结果,或者改变文节间的切分。当然,如果不用进行选字,默认的转换结果就是对的,那当然是最好的了。转换精度的优劣是决定输入法性能的决定性因素之一。

各输入法收入有假名汉字转换用的词汇数据库(日语称之为“系统辞典”,和“用户辞典”相对)。在汉字之外也收录有符号/特殊文字、英语单词、表情符号、方言词汇、网络语言等等,有的输入法利用转换系统,实现了邮政编码转换为地名、翻译、计算等功能。

在许多输入法中,用户可以将自己需要的词汇加入到用户辞典里去。输入法自动学习功能强大、系统自带辞典丰富的话,可以减少自定义词汇的工作量。有的输入法可以把某个不需要却常常出现在转换结果候选的里的词通过设置屏蔽。

通过用户的转换、选字的结果增加未来的转换精度。通过自动学习,输入法可以更加切合个人的需要,但是有时错误的选字结果也被学习了,下次选字时就会出现在前面给人带来麻烦。ATOK等等可以直接编辑转换历史记录删除不要的转换结果。

有时学习数量过多,反而降低了转换精度,或使得学习功能异常(参见Microsoft IME)。此时需要重新初始化输入法的学习结果。

减少输入字数的输入预测(入力予测)功能,在和电脑相比输入速度慢的手机系统上得到了发展。之后,在2000年代后期,ATOK和Google日文输入法等电脑用的输入法中也加入了输入预测功能。Google日文输入法的预测功能使用的是从Google搜索系统中得来的数据,和手机系统的输入预测的工作方式不同。

有的输入法为帮助用户正确选择同音词,会在选字时出现解说同音词意思、用法的弹出窗口。

有的能够打字很快的用户会觉得,如果使用输入预测,则需要在预测列表中一一选择自己需要的词,反而降低了打字速度,因此辅助功能对他们是多余的。此外选字时弹出的解说词义窗口有时会影响程序的反应速度。因此许多输入法中的输入辅助功能是可以选择不使用的。

相关

  • 亚萨格雷阿薩·格雷(英语:Asa Gray;1810年11月18日-1888年1月30日),被誉为是19世纪最重要的美国植物学家。木藜芦毒素之原文即以其姓氏命名。
  • 中国鸟龙中国鸟龙属(属名:Sinornithosaurus,意为“中国的鸟蜥蜴”),是种驰龙科的有羽毛恐龙,化石发现于中国的义县组,年代为下白垩纪的中巴列姆阶。中国鸟龙是第五个发现的有羽毛恐龙,并且在
  • UTC−5UTC−05:00时区比协调世界时慢5小时,使用于北美中部时区(夏令时间)。
  • 古风野牛古风野牛(学名:Bison antiquus)是1万年前更新世晚期时北美洲最普遍的大型草食性动物,且是现存美洲野牛的直接祖先。西伯利亚野牛于更新世冰河时期(大约 240,000 至 220,000 年前)
  • FIBE-MINIFIBE-MINI源自日本、始于1988年,是由宝矿力水特同一公司 — 大冢制药研制而成,是即饮食用纤维的先导。它含有丰富食用纤维,自1988年起,日本FIBE-MINI的销量已达24亿支。FIBE-MIN
  • 朱莉·冈萨洛朱莉·冈萨洛(英语:Julieta Susana "Julie" Gonzalo,1981年9月9日-)是阿根廷裔美国女演员,最著名的角色是美眉校探中的Parker Lee,灰姑娘的故事中的Shelby以及神奇律师中的Maggie D
  • 陆一鹏 (嘉靖进士)陆一鹏(?-?),字应程,浙江绍兴府余姚县人,明朝政治人物。浙江乡试第五十七名。嘉靖三十五年(1556年)丙辰科进士。隆庆二年(1568年)官广西梧州府知府。曾祖父陆端;祖父陆怀;父陆�,曾任县丞。母
  • 即使如此依旧步步进逼日文版单行本第一册封面《即使如此依旧步步进逼》(日语:それでも歩は寄せてくる)是由日本漫画家山本崇一朗所创作的少年漫画作品,于《周刊少年Magazine》2019年14号上开始连载。
  • 梅光达梅光达(1850年-1903年;英语:Mei Quong Tart)是19世纪悉尼的著名华侨商人。他是当时悉尼最著名并最受爱戴的闻人之一,在澳大利亚反华情绪高涨的时代却对悉尼的社会和政治生活产生重
  • 时-方法-地在语言类型学中,时-方法-地是一般状语的顺序。例如,应以"昨天"(时间)、"车"(方法)、"到店铺"(地方)的顺序排列。日语、荷兰语和德语都属于