国际化中,CJK文字是中文、日文和韩文的统称,这些语言全部含有汉字及其变体,某些会与其他文字混合使用。因为越南文曾经使用汉字,所以它有时候与CJK文字结合,组成CJKV文字。概括来说,CJKV文字通常包括中文的汉字、日文的汉字及假名、韩文的汉字及谚文和越南文的儒字和喃字。
标准普通话和广东话几乎可以全数使用中文表达,基本识字需要3000字,而囊括全部日常用语则需要40000字。日文使用较少汉字-日文基本识字只包含2163字,列举于常用汉字表。韩国使用汉字的情况越来越少,但因为特殊的专有名词需要更多的字符解释,所以仍需要学习汉字。时至今日,韩国学校仍教授学生约1800字。
中文的注音和汉语拼音、日文的平假名和片假名、韩文的谚文,严格上都不是“CJK文字”。但多数CJK字集为了涵盖目标语言的全部文字,而包括这些拼音文字。
直至20世纪初,越南政府和学界沿用文言文为书写语言,当时越南的流行读物却是结合中文汉字和大量越南本土制造的文字,以喃字撰写。1920年代末,喃字及文言文被基于拉丁字母的越南文字母取代。
1971年,中国学学家卡尔莱班制造了CJK编码系统的原形。
虽然各种CJK编码有相同的字集,东亚各地政府和软件公司制造出不同和不相通的编码。万国码联盟曾经尝试统一汉字字集,惹来各种争议。