KS X 1001是韩国用于书写的谚文和汉字的字符编码规格。以前称作KS C 5601,现在多称作KS X 1001,有时也简称为KS编码。
其与JIS X 0208的94×94字集类似,包含谚文2,350字、汉字4,888字、英文字母、数字和假名共,8226字。谚文是由字母组合成一个音节的,但在这种编码中用一个字符表示一整个音节,难以包括所有可能的组成符号,存在许多无法表示的音节,受到许多批评。百事可乐的韩国法人因 KS X 1001 不含“펲”,在1992年改用 KS X 1001 中存在的谚文“펩”表示。
汉字则是照读音顺序来配置的。朝鲜语原则上一字一音,但也存在破音字,KS X 1001对这样的汉字在不同的读音位置重复编码。这被称为“预组合字符编码”(Wansung,韩语:완성,罗马化:,直译:预组合)。
虽然也有不一样的,使用头音法则,即转成最先遇到的那个读音,但如“盧”和“李”如此常用的字也有别的读音和重复编码。最多的是有4个重复编码的“樂”。这个方式的好处是、字的读音利于机械的判定,但却也被批评违反字符编码的大原则。此外,这样重复编码的汉字在统一码和通用字符集中因互换性的关系,中日韩统一表意文字只收录一个、其它的则收录于中日韩兼容汉字。
KS X 1001在EUC的编码称作韩文EUC(EUC-KR)。实际上,KS X 1001 完全没有被用于其它编码(ISO-2022-KR完全没有被使用),单独的 KS C 5601 通常意指 EUC-KR 。
一些电脑系统将此标准改编成诸多版本。但他们并非完全一致,如将原标准中放在 0x5C 的反斜线改成韩圆(₩)。有些系统则使用非常规方法来扩展此标准。KS X 1001 可编码成 EUC-KR、Windows-949(EUC-KR 的超集)、ISO-2022-KR 和“双字节合型符号”(Johab)。但后二个很少使用。
朝鲜则使用另一规格KPS 9566。