KS X 1001

KS X 1001
KS X 1001
MIME / IANAks_c_5601-1991
에일리어스KS C 5601
언어한국어, 영어, 러시아어, 불가리아어, 이누크티투트(라틴어)
부분 지원:
그리스어, 일본어, 덴마크어, 노르웨이어 등
표준.KS X 1001
분류ISO-2022 호환 DBCS, CJK 인코딩
인코딩 형식EUC-KR, ISO 2022, UHC, Johab
선행N바이트 한글 코드(KS C 5601-1974)
기타 관련 부호화KS X 1002, KPS 9566, JIS X 0208, GB 2312, GB 12052

KS X 1001, "정보교환용 코드(한글과 한자)"[a][1]는 한글과 한자를 컴퓨터 상에서 표현하기 위한 한글 코드 세트 표준이다.

KS X 1001은 EUC-KR 및 마이크로소프트의 통합 한글 코드(UHC)를 포함하여 가장 일반적인 한글(Unicode 이전) 문자 인코딩으로 인코딩됩니다.한글 음절, CJK 한자, 그리스어, 키릴어, 일본어, 히라가나, 가타카나 등의 문자가 포함되어 있다.

KS X 1001은 ISO 2022 EUC의 2바이트 코드워드 구조에 따라 94×94 테이블로 배열되어 있습니다.따라서 코드 포인트는 1 ~94의 정수 입니다.그러나 일부 인코딩(UHC 및 Johab)은 모든 코드 포인트에 대한 코드를 제공할 뿐만 아니라 코드 포인트 시퀀스로만 표시될 수 있는 문자에 대한 추가 코드를 제공합니다.

역사

이 표준은 이전에는 KS C 5601로 알려져 있었습니다.이 기준에는 몇 가지 개정이 있었다.예를 들어 1987년, 1992년, 1998년 및 2002년에 개정안이 있었다.

현재의 더블바이트 완성 문자 집합[3]1986년에 발간된 [1]KS C 5601 [2]제3판을 통해 표준화되었다.ISO 2022와 호환되지 않지만 현대 자모를 사용하여 모든 한글 음절에 2바이트 코드를 할당하는 것과 달리, 비한글,[1] 한글 자모 [2]및 가장 일반적인 한글 음절에 2바이트 코드를 할당하는 ISO 2022 호환 인코딩이다.완성은 기술적으로 가변 길이 인코딩으로 다른 음절을 (자모 및 한글 필러 문자를 사용하여) 8바이트 시퀀스로 나타낼 수 있지만 이 기능이 항상 [4]구현되는 것은 아닙니다.

1974년에 [2]발행된 KS C 5601의 초기 판은 가변 길이[2] 7비트 문자 집합을 정의하여 JIS C 6220과 다소 유사한 51개의 기본 한글 [5]자모에 싱글[3] 바이트 코드 포인트를 할당하였다.1982년에 출판된 제2판은 1974년판부터의 주인공 세트를 유지했지만, Johab 버전을 포함한 두 개의 보충 세트를 정의했다.어느 판도 [2]의도한 만큼 널리 채택되지 않았다.

완성은 1987년과 1992년 판에서도 변하지 않았다.1992년 판에서는 부속서 3의 조합[6] 부호화 정의와 부속서 [1][5]4의 구형 N바이트 한글 부호화 정의를 포함한 부속서 자료가 [3]추가되었다.당시 한글 워드프로세서가 사용하던 완성에 대한 경쟁 인코딩으로 산업계가 조합(Johab)을 사용한 것에 대응하여 발행되었다.마이크로소프트가 윈도우 95에서 통합 한글 코드를 도입하고, 2000년 한글 워드 프로세서가 유니코드를 위해 조합을 포기하면서, [2]조합은 일반적으로 사용되지 않게 되었다.

인코딩

(A screenshot of an old version of Firefox showing Big5, GB2312, GBK, GB18030, HZ, ISO-2022-CN, Big5-HKSCS, EUC-TW, EUC-JP, ISO-2022-JP, Shift_JIS, EUC-KR, UHC, Johab and ISO-2022-KR as available encodings under the CJK sub-menu.)
2004년 현재 Mozilla Firefox에 의해 지원되는 KS X 1001 기반의 4개의 CJK 인코딩(이 지원은 특정 사이트 간 스크립팅 공격을 피하기 위해 이후 버전에서 축소되었습니다.)

KS X 1001의 부호화 방식에는 EUC-KR(ASCII 및 ISO 646-KR 베이스의 바리안트, 후자는 백슬래시가 아닌 0x5C 바이트의 원화 기호())를 포함한다), ISO-2022-KR([7]JIS 022-JP-2 및 0220 XJIS부호화한다)가 있습니다.이들은 모두 자체 KS X 1001 코드포인트(전체 11172개 중 구식 자모를 사용하지 않음)를 가진 2350개의 사전 구성 한글 음절에만 코드를 할당하고, 다른 사람들은 8바이트 구성 시퀀스를 사용하도록 요구한다는 단점이 있는데,[4] 이는 일부 표준 구현에서는 지원되지 않습니다.

Johab 부호화(1992년판 표준 부속서 3에 기재)와 통합 한글 코드(UHC, Windows-949)로 알려진 EUC-KR 슈퍼셋은 모든 11172 한글 [7][6]음절에 대해 단일 코드를 제공합니다.ISO-2022-KR 및 Johab은 거의 사용되지 않습니다.일부 운영 체제는 이 표준을 다른 비균일한 방식으로 확장합니다. 예를 들어, 기존 Mac OS의 EUC-KR 확장 MacKorean IBM의 IBM-949가 이에 해당합니다.

한글 필러

한글 필러 문자는 8바이트 한글 구성[8][9] 시퀀스를 소개하고 이러한 [9]시퀀스에서 누락된 요소(일반적으로 빈 최종 요소)를 대신하기 위해 사용됩니다.

유니코드는 왕복 호환성을 위해 한글 호환성 자모 블록에 완성코드 한글 필러를 포함하지만 한글 작성에는 자체 시스템(필러 문자)을 사용한다.KS X 1001 한글 구성 체계는 유니코드에서는 사용되지 않으며, 필러는 빈 공간으로 렌더링됩니다. 현대 자모를 사용한 KS X 1001 구성 시퀀스는 유니코드 [9]사전 구성 문자에 매핑될 수 있습니다.이것은 보통 통일 한글 코드에서는 행해지지 않습니다.

왕복 호환성을 위해 Unicode는 "Halfwidth and Fullwidth Forms" 블록에 N바이트 한글 코드 한글 필러를 별도로 포함합니다.

N바이트 한글 코드

이는 KS C 5601-1974 및 KS C 5601-1992의 부속서 4에 명시된 N바이트 한글 [5]코드입니다.IBM의 코드 페이지[10] 1040의 후반부는 이 중 상위 집합으로, 문자를 할당합니다.¢¬\~(단, 아닙니다만)£코드 페이지 1041과 동일한 위치에 있는 반면 확장되지 않은 N바이트 한글(일부 사용 컨텍스트에서 C0 제어 코드 대체 그래픽을 제외하고 IBM-1040과 공유됨)은 코드 페이지 891입니다.[11]문자 0x40/0xC0은 시퀀스 조합에 사용되는 한글 필러(상기 참조)입니다.

일본의 JIS C6220(JIS X 0201)과 마찬가지로 N바이트 한글 코드를 7비트 인코딩으로 사용할 수 있으며 [5]0x40~0x7C 범위의 문자를 할당할 수 있습니다.다음 표는 코드 페이지 891 또는 1040에서 사용되는 것과 같이 높은 비트 설정(0xC0 ~ 0xFC 이상)이 있는 8비트 환경의 코드를 보여 줍니다.

KS C 5601-1974 / N바이트[12] 한글
0 1 2 3 4 5 6 7 8 9 A B C D E F
8배
9배
도끼
Bx
Cx HWHF
Dx
Fx

완성코드 차트

완성 레이아웃의 KS X 1001 코드 차트는 다음과 같습니다.16 진수의 페어가 지정되어 있는 경우는, 한국어 세트가 ISO-2022-KR 로 이행했을 때와 같이, GL(0x21-0x7E) 경유로 부호화되는 경우는, 작은 것이, EUC-KR 또는 UHC 로 부호화되는 경우는, 보다 일반적인 경우(0xA1-0xFE)로 부호화되는 경우는, 큰 것이 사용됩니다.조합은 11172개의 한글 군집을 개별적으로 순서대로 인코딩하도록 배열을 변경합니다.

벤더의 구현의 차이를 설명하기 위해 일부 문자에 대해 여러 Unicode 매핑을 보여 줍니다.Wansung 플레인에 대한 Apple의 한글 Talk 확장자(즉, 양쪽 바이트가 0xA1-0xFE 범위)가 표시되지만 다른 한글 Talk 확장자 범위는 표시되지 않습니다.통합 한글 코드의 합성 음절에 대한 추가 코드와 IBM-949의 IBM 확장자 또한 둘 다 완성 평면 밖에 있기 때문에 표시되지 않는다.

리드 바이트

KS X 1001 (완성코드)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배 SP[b] 1-_ 2-_ 3-_ 4-_ 5-_ 6-_ 7-_ 8-_ 9-_ 10-_ 11-_ 12-_ 13-_ 14-_ 15-_
3배/B배 16-_ 17-_ 18-_ 19-_ 20-_ 21-_ 22-_ 23-_ 24-_ 25-_ 26-_ 27-_ 28-_ 29-_ 30-_ 31-_
4배속/Cx 32-_ 33-_ 34-_ 35-_ 36-_ 37-_ 38-_ 39-_ 40-_ 41-_ 42-_ 43-_ 44-_ 45-_ 46-_ 47-_
5배속/깊이 48-_ 49-_ 50-_ 51-_ 52-_ 53-_ 54-_ 55-_ 56-_ 57-_ 58-_ 59-_ 60-_ 61-_ 62-_ 63-_
6배속/Ex 64-_ 65-_ 66-_ 67-_ 68-_ 69-_ 70-_ 71-_ 72-_ 73-_ 74-_ 75-_ 76-_ 77-_ 78-_ 79-_
7x/Fx 80-_ 81-_ 82-_ 83-_ 84-_ 85-_ 86-_ 87-_ 88-_ 89-_ 90-_ 91-_ 92-_ 93-_ 94-_ [b]

비한자 사전 구성 집합

문자 집합 0x21 / 0xA1(1행, 특수 문자)

이 집합에는 KS X 1003(3행에 포함)에 있는 구두점을 제외한 구두점 및 기타 기호가 포함됩니다.KS X 1001을 싱글바이트 ASCII와 조합하는 인코딩에서는 백슬래시에 대해 하프폭풀폭 폼블록에 대한 대체 유니코드 매핑을 사용할 수 있습니다.Wave Dash(칠데 대시)의 Unicode 매핑도 벤더마다 다르며 U+301C(IBM [13][14][15]및 Apple에서 제공) 또는 U+223C(Microsoft에서 [16][17]제공)가 될 수 있습니다.JIS 웨이브 대시와 다음 줄의 칠데의 취급을 비교합니다.

백슬래시를 제외하고 아래에 2개의 매핑이 표시되어 있는 경우 첫 번째 매핑은 Apple에 의해 사용되고 두 번째 매핑은 Microsoft에 [15][17]의해 사용됩니다.

KS X 1001 (0x21 / 0xA1로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배 IDSP · ¨ 부끄럽다 -/- / ∥∥ \/contractions.\/contractions(표준) /
3배/B배 ± ×
4배속/Cx ÷ ° ¢ / ¢¢ 파운드/파운드 ¥ / ¥¥
5배속/깊이 §
6배속/Ex
7x/Fx ¬ / ¬

문자 집합 0x22 / 0xA2(2행, 특수 문자)

이 세트에는 추가 구두점과 기호가 포함되어 있습니다.이전 행의 칠데 문자와 마찬가지로 이 행의 칠데 문자(Apple에서는 U+02DC,[15][17] Microsoft에서는 FF5E)에 대해 다른 매핑이 사용되며, 이전 행의 칠데는 대시 [18]높이로 인라인으로 표시됩니다.동그라미가 쳐진 점의 [15][17]매핑도 다릅니다.

유로화와 등록 상표 표기는 1998년에 표준으로 추가되었고,[1] 한국 우편 마크())는 2002년에 추가되었다.이들 3개의 코드 포인트는 아직 사용되지 않은 코드 포인트와 마찬가지로 벤더에 의해 다른 [19]비표준적인 목적으로 사용되고 있습니다.예를 들어 Apple의 박스형 리스트 마커에 사용됩니다.MS는 1998년 유로화를 포함한 추가사항을 추가하기 위해 통일 한글 코드 시행을 업데이트했지만,[20] 표준에 추가될 때는 한글 마크를 추가하지 않았다.

KS X 1001 (0x22 / 0xA2로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배 ´ //~ ˇ ˘ ˝ ˚ ˙ ¸ ˛ ¡ ¿
3배/B배 ː ¤
4배속/Cx / ⊙
5배속/깊이
6배속/Ex 1파운드당 [c] ®/2개[c] 3분 1[c] 4인치[c] 5인치[c] 6인치[c] 7인치[c] 8인치[c] 9인치[c] [10][d]
7x/Fx [11][d] [12][d] [13][d] [14][d] [15][d] [16][d] [17][d] [18][d] [19][d] [20][d] [e] 𝄂[f] 𝄃[g]
Apple에 의한 추가 정보
Apple의 추가 기능과 충돌하는 최신 표준 추가

문자 집합 0x23/0xA3(3행 번호, 기본 라틴어/ISO 646-KR)

이 세트는 KS X 1003(한국어의 ISO 646 변형, ASCII와 유사한 세트)에 대응하지만 2바이트 코드 앞에 0x23(또는 GR 위임(EUC) 형식의 0xA3)이 붙습니다.영어 알파벳/기본 라틴 알파벳, 아랍어 서부 숫자 및 구두점이 포함됩니다.

JIS X 0201의 로마식 세트를 비교해 보십시오.이것은 원 기호 대신 기호를 포함하는 것으로 다릅니다.ISO 646 레이아웃에 따르지만 문자와 숫자만 포함하는 KPS 9566 JIS X 0208의 세 번째 과 대조합니다.

KS X 1001(0x23/0xA3으로 프리픽스), 비전폭 매핑
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배 ! " # $ % & ' ( ) * + , - . /
3배/B배 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4배속/Cx @ A B C D E F G H I J K L M N O
5배속/깊이 P Q R S T U V W X Y Z [ ] ^ _
6배속/Ex ` a b c d e f g h i j k l m n o
7x/Fx p q r s t u v w x y z { }

EUC-KR 및 UHC 등의 인코딩은 KS X 1001을 싱글바이트 ASCII 또는 KS X 1003과 결합하기 때문에 이러한 문자를 더블바이트로 표현하기 위해 Halfwidth Fullwidth Forms 블록에 대한 대체 Unicode 매핑을 사용합니다.

KS X 1001(0x23/0xA3으로 프리픽스), 전폭 매핑
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배
3배/B배
4배속/Cx A. B. C. D. E. 에프 J. K.
5배속/깊이 P. 질문 S. T. 브이 X. Y. _
6배속/Ex 1개 b. c. 에프 아이
7x/Fx p. s. t. V x. y.

문자 집합 0x24 / 0xA4 (4행, 한글 자모)

이 세트에는 현대 한글 자음, 모음, 남한 대조 세관에 의해 순서가 매겨진 모음, 그리고 사용되지 않는 자음이 포함되어 있습니다.이러한 문자를 개별적으로 사용하는 경우 유니코드 한글 호환성 자모 블록에 매핑되며 한글 자모 블록의 위치별 문자와의 일대일 매핑은 없습니다.북한의 KPS 9566의 4열과 비교해 보십시오.문자 04-52는 시퀀스 조합에 사용되는 한글 필러(위 참조)입니다.

KS X 1001 (0x24 / 0xA4로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배
3배/B배
4배속/Cx
5배속/깊이 고주파
6배속/Ex
7x/Fx

문자 집합 0x25 / 0xA5 (5행, 로마 숫자 및 그리스어)

이 세트에는 로마 숫자와 그리스 알파벳에 대한 기본 지원이 포함되어 있으며, 분음 부호나 마지막 시그마 없이 사용할 수 있습니다.Apple은 [19]이 행에 구두점을 추가하고 6행에서 이어지는 검은색 동그라미 목록 마커를 포함합니다.

KPS 9566의 대조행 6은 같은 문자를 포함하지만 레이아웃은 다릅니다.

KS X 1001 (0x25 / 0xA5로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배
3배/B배
4배속/Cx 알파 β Γ Δ Ε Ζ Η Θ Ι Κ Λ 마이크로미터 Ν Ξ ο
5배속/깊이 Π Ρ Σ Τ Υ Φ Χ Ψ Ω !︀[h] 。︀[i] [j] [j]
6배속/Ex α β γ δ ε ζ η θ ι κ λ μ ν ξ opus
7x/Fx π ρ σ τ υ φ χ ψ ω (27)[k] (28)[l] (29)[m] (30)[n]
Apple에 의한 추가 정보

문자 집합 0x26 / 0xA6(6행, 상자 그리기)

이 행에는 반문맥에서 상자를 그리기 위한 문자가 포함되어 있습니다.Apple은 또한 검은색 동그라미 목록 [19]마커를 포함합니다.

KS X 1001 (0x26 / 0xA6으로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배
3배/B배
4배속/Cx
5배속/깊이
6배속/Ex
7x/Fx (21)[o] (22)[p] (23)[q] (24)[r] (25)[s] (26)[t]
Apple에 의한 추가 정보

문자 집합 0x27/0xA7(7행 번호, 단위 기호)

이 행에는 여러 문자로 구성된 단위 기호가 단일 문자로 포함됩니다.Apple은 또한 [19]8행에서 이어지는 동그라미 목록 마커를 포함합니다.

KPS 9566의 8행에 포함된 단위 기호 레퍼토리와 비교 및 대조합니다.

KS X 1001 (0x27 / 0xA7로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배
3배/B배
4배속/Cx
5배속/깊이
6배속/Ex
7x/Fx
Apple에 의한 추가 정보

문자 집합 0x28 / 0xA8(8행 번호, 확장 라틴어, 동그라미, 분수)

KS X 1001 (0x28 / 0xA8로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배 ð ª Ħ IJ Ŀ ł ø Œ º Þ Ŧ Ŋ
3배/B배
4배속/Cx
5배속/깊이
6배속/Ex
7x/Fx ½ ¼ ¾

문자 집합 0x29 / 0xA9(9행 번호, 확장 라틴어, 동그라미, 위첨자 및 아래첨자)

KS X 1001 (0x29/0xA9로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배 æ ð ħ ı ij ĸ ŀ ł ø œ ß þ ŧ ŋ
3배/B배 ʼn
4배속/Cx
5배속/깊이
6배속/Ex
7x/Fx ¹ ² ³

문자 집합 0x2A/0xAA(10행, 히라가나)

세트에는 일본어 표기용 히라가나가 포함되어 있습니다.Apple은 또한 [19]9행에서 이어지는 괄호로 묶인 목록 마커를 포함합니다.

같은 레이아웃을 사용하는 KPS 9566의 10열을 비교합니다.JIS X 0208의 4행도 같은 레이아웃이지만 다른 행으로 비교 및 대조합니다.

KS X 1001(0x2A/0xAA로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배
3배/B배
4배속/Cx
5배속/깊이
6배속/Ex
7x/Fx (21)[u] (22)[u] (23)[u] (24)[u] (25)[u] (26)[u]
Apple에 의한 추가 정보

문자 집합 0x2B / 0xAB (11행, 가타카나)

세트에는 일본어 표기용 가타카나가 포함되어 있습니다., JIS X 0208의 1행에 포함되는 가타카나 텍스트에 사용되는 일본어 장모음 표기는 [23]포함되지 않습니다.Apple은 또한 9행과 [19]10행에 이어지는 괄호로 묶인 목록 마커를 포함합니다.

같은 레이아웃을 사용하는 KPS 9566의 11열을 비교합니다.JIS X 0208의 행 5를 비교하고 대조합니다.이 행은 같은 레이아웃이지만 다른 행으로 되어 있습니다.

KS X 1001(0x2B/0xAB로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배
3배/B배
4배속/Cx
5배속/깊이
6배속/Ex
7x/Fx (27)[u] (28)[u] (29)[u] (30)[u]
Apple에 의한 추가 정보

문자 집합 0x2C/0xAC(행 번호 12, 키릴 문자)

이 세트는 현대 러시아어 알파벳을 포함하고 있으며, 키릴 문자의 다른 형식을 나타내기에는 반드시 충분하지 않습니다.애플은 또한 블랙박스 목록 [19]마커를 포함하고 있다.

같은 레이아웃(다른 행)을 사용하는 KPS 9566의 5행과 JIS X 0208의 7행비교합니다.

KS X 1001 (0x2C/0xAC로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배 А Б В Г Д Е Ё Ж З И Й К Л М Н
3배/B배 О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э
4배속/Cx Ю Я 1인치[v] 2인치[v] 3인치[v] 4인치[v] 5인치[v] 6인치[v] 7인치[v] 8인치[v] 9인치[v] [10][w] [11][w] [12][w] [13][w] [14][w]
5배속/깊이 [15][w] а б в г д е ё ж з и й к л м н
6배속/Ex о п р с т у ф х ц ч ш щ ъ ы ь э
7x/Fx ю я [16][w] [17][w] [18][w] [19][w] [20][w]
Apple에 의한 추가 정보

확장 문자 집합 0x2D/0xAD(행 번호 13, Apple 추가 구두점)

KS X 1001에 Apple 추가(0x2D/[19]0xAD로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
축당 2배 [x] [x] [x] [x] [y] [y] [y] [y] [z] [z] 🠩[아아아아아아아아아아아아아아아아아아]
3배/B배 ![ab]

사전 구성 한글 세트(16~40행)

미리 구성된 한글용 코드 포인트는 코드 포인트 16-01과 40-94 사이의 연속 정렬된 블록에 포함된다.가능한 모든 음절 클러스터가 이 범위에 포함되는 것은 아닙니다.KPS 9566의 다양한 주문과 가용성을 비교합니다.

initial+vowel+final 음절 ,, ,, ,, are는 포함되지만 initial+vowel 대응어 ,, ,, , 및 쬬는 포함되지 않습니다.초기+최종 음절(예: → → → → 한)을 입력하려면 입력 방법이 먼저 초기+음절+음절+음절을 통과해야 하므로 입력 시 문제가 발생하곤 했습니다.

여기에 나열되지 않은 항목은 8바이트 구성 시퀀스를 사용하여 나타낼 수 있습니다.다른 모든 현대 자모 클러스터는 UHC에 의해 다른 곳에 코드가 할당됩니다.가능한 모든 현대 자모 군집은 Johab에 의해 코드가 할당됩니다.

  • Row 16: 가 각 간 갇 갈 갉 갊 감 갑 값 갓 갔 강 갖 갗 같 갚 갛 개 객 갠 갤 갬 갭 갯 갰 갱 갸 갹 갼 걀 걋 걍 걔 걘 걜 거 걱 건 걷 걸 걺 검 겁 것 겄 겅 겆 겉 겊 겋 게 겐 겔 겜 겝 겟 겠 겡 겨 격 겪 견 겯 결 겸 겹 겻 겼 경 곁 계 곈 곌 곕 곗 고 곡 곤 곧 골 곪 곬 곯 곰 곱 곳 공 곶 과 곽 관 괄 괆
  • Row 17: 괌 괍 괏 광 괘 괜 괠 괩 괬 괭 괴 괵 괸 괼 굄 굅 굇 굉 교 굔 굘 굡 굣 구 국 군 굳 굴 굵 굶 굻 굼 굽 굿 궁 궂 궈 궉 권 궐 궜 궝 궤 궷 귀 귁 귄 귈 귐 귑 귓 규 균 귤 그 극 근 귿 글 긁 금 급 긋 긍 긔 기 긱 긴 긷 길 긺 김 깁 깃 깅 깆 깊 까 깍 깎 깐 깔 깖 깜 깝 깟 깠 깡 깥 깨 깩 깬 깰 깸
  • Row 18: 깹 깻 깼 깽 꺄 꺅 꺌 꺼 꺽 꺾 껀 껄 껌 껍 껏 껐 껑 께 껙 껜 껨 껫 껭 껴 껸 껼 꼇 꼈 꼍 꼐 꼬 꼭 꼰 꼲 꼴 꼼 꼽 꼿 꽁 꽂 꽃 꽈 꽉 꽐 꽜 꽝 꽤 꽥 꽹 꾀 꾄 꾈 꾐 꾑 꾕 꾜 꾸 꾹 꾼 꿀 꿇 꿈 꿉 꿋 꿍 꿎 꿔 꿜 꿨 꿩 꿰 꿱 꿴 꿸 뀀 뀁 뀄 뀌 뀐 뀔 뀜 뀝 뀨 끄 끅 끈 끊 끌 끎 끓 끔 끕 끗 끙
  • Row 19: 끝 끼 끽 낀 낄 낌 낍 낏 낑 나 낙 낚 난 낟 날 낡 낢 남 납 낫 났 낭 낮 낯 낱 낳 내 낵 낸 낼 냄 냅 냇 냈 냉 냐 냑 냔 냘 냠 냥 너 넉 넋 넌 널 넒 넓 넘 넙 넛 넜 넝 넣 네 넥 넨 넬 넴 넵 넷 넸 넹 녀 녁 년 녈 념 녑 녔 녕 녘 녜 녠 노 녹 논 놀 놂 놈 놉 놋 농 높 놓 놔 놘 놜 놨 뇌 뇐 뇔 뇜 뇝
  • Row 20: 뇟 뇨 뇩 뇬 뇰 뇹 뇻 뇽 누 눅 눈 눋 눌 눔 눕 눗 눙 눠 눴 눼 뉘 뉜 뉠 뉨 뉩 뉴 뉵 뉼 늄 늅 늉 느 늑 는 늘 늙 늚 늠 늡 늣 능 늦 늪 늬 늰 늴 니 닉 닌 닐 닒 님 닙 닛 닝 닢 다 닥 닦 단 닫 달 닭 닮 닯 닳 담 답 닷 닸 당 닺 닻 닿 대 댁 댄 댈 댐 댑 댓 댔 댕 댜 더 덕 덖 던 덛 덜 덞 덟 덤 덥
  • Row 21: 덧 덩 덫 덮 데 덱 덴 델 뎀 뎁 뎃 뎄 뎅 뎌 뎐 뎔 뎠 뎡 뎨 뎬 도 독 돈 돋 돌 돎 돐 돔 돕 돗 동 돛 돝 돠 돤 돨 돼 됐 되 된 될 됨 됩 됫 됴 두 둑 둔 둘 둠 둡 둣 둥 둬 뒀 뒈 뒝 뒤 뒨 뒬 뒵 뒷 뒹 듀 듄 듈 듐 듕 드 득 든 듣 들 듦 듬 듭 듯 등 듸 디 딕 딘 딛 딜 딤 딥 딧 딨 딩 딪 따 딱 딴 딸
  • Row 22: 땀 땁 땃 땄 땅 땋 때 땍 땐 땔 땜 땝 땟 땠 땡 떠 떡 떤 떨 떪 떫 떰 떱 떳 떴 떵 떻 떼 떽 뗀 뗄 뗌 뗍 뗏 뗐 뗑 뗘 뗬 또 똑 똔 똘 똥 똬 똴 뙈 뙤 뙨 뚜 뚝 뚠 뚤 뚫 뚬 뚱 뛔 뛰 뛴 뛸 뜀 뜁 뜅 뜨 뜩 뜬 뜯 뜰 뜸 뜹 뜻 띄 띈 띌 띔 띕 띠 띤 띨 띰 띱 띳 띵 라 락 란 랄 람 랍 랏 랐 랑 랒 랖 랗
  • Row 23: 래 랙 랜 랠 램 랩 랫 랬 랭 랴 략 랸 럇 량 러 럭 런 럴 럼 럽 럿 렀 렁 렇 레 렉 렌 렐 렘 렙 렛 렝 려 력 련 렬 렴 렵 렷 렸 령 례 롄 롑 롓 로 록 론 롤 롬 롭 롯 롱 롸 롼 뢍 뢨 뢰 뢴 뢸 룀 룁 룃 룅 료 룐 룔 룝 룟 룡 루 룩 룬 룰 룸 룹 룻 룽 뤄 뤘 뤠 뤼 뤽 륀 륄 륌 륏 륑 류 륙 륜 률 륨 륩
  • Row 24: 륫 륭 르 륵 른 를 름 릅 릇 릉 릊 릍 릎 리 릭 린 릴 림 립 릿 링 마 막 만 많 맏 말 맑 맒 맘 맙 맛 망 맞 맡 맣 매 맥 맨 맬 맴 맵 맷 맸 맹 맺 먀 먁 먈 먕 머 먹 먼 멀 멂 멈 멉 멋 멍 멎 멓 메 멕 멘 멜 멤 멥 멧 멨 멩 며 멱 면 멸 몃 몄 명 몇 몌 모 목 몫 몬 몰 몲 몸 몹 못 몽 뫄 뫈 뫘 뫙 뫼
  • Row 25: 묀 묄 묍 묏 묑 묘 묜 묠 묩 묫 무 묵 묶 문 묻 물 묽 묾 뭄 뭅 뭇 뭉 뭍 뭏 뭐 뭔 뭘 뭡 뭣 뭬 뮈 뮌 뮐 뮤 뮨 뮬 뮴 뮷 므 믄 믈 믐 믓 미 믹 민 믿 밀 밂 밈 밉 밋 밌 밍 및 밑 바 박 밖 밗 반 받 발 밝 밞 밟 밤 밥 밧 방 밭 배 백 밴 밸 뱀 뱁 뱃 뱄 뱅 뱉 뱌 뱍 뱐 뱝 버 벅 번 벋 벌 벎 범 법 벗
  • Row 26: 벙 벚 베 벡 벤 벧 벨 벰 벱 벳 벴 벵 벼 벽 변 별 볍 볏 볐 병 볕 볘 볜 보 복 볶 본 볼 봄 봅 봇 봉 봐 봔 봤 봬 뵀 뵈 뵉 뵌 뵐 뵘 뵙 뵤 뵨 부 북 분 붇 불 붉 붊 붐 붑 붓 붕 붙 붚 붜 붤 붰 붸 뷔 뷕 뷘 뷜 뷩 뷰 뷴 뷸 븀 븃 븅 브 븍 븐 블 븜 븝 븟 비 빅 빈 빌 빎 빔 빕 빗 빙 빚 빛 빠 빡 빤
  • Row 27: 빨 빪 빰 빱 빳 빴 빵 빻 빼 빽 뺀 뺄 뺌 뺍 뺏 뺐 뺑 뺘 뺙 뺨 뻐 뻑 뻔 뻗 뻘 뻠 뻣 뻤 뻥 뻬 뼁 뼈 뼉 뼘 뼙 뼛 뼜 뼝 뽀 뽁 뽄 뽈 뽐 뽑 뽕 뾔 뾰 뿅 뿌 뿍 뿐 뿔 뿜 뿟 뿡 쀼 쁑 쁘 쁜 쁠 쁨 쁩 삐 삑 삔 삘 삠 삡 삣 삥 사 삭 삯 산 삳 살 삵 삶 삼 삽 삿 샀 상 샅 새 색 샌 샐 샘 샙 샛 샜 생 샤
  • Row 28: 샥 샨 샬 샴 샵 샷 샹 섀 섄 섈 섐 섕 서 석 섞 섟 선 섣 설 섦 섧 섬 섭 섯 섰 성 섶 세 섹 센 셀 셈 셉 셋 셌 셍 셔 셕 션 셜 셤 셥 셧 셨 셩 셰 셴 셸 솅 소 속 솎 손 솔 솖 솜 솝 솟 송 솥 솨 솩 솬 솰 솽 쇄 쇈 쇌 쇔 쇗 쇘 쇠 쇤 쇨 쇰 쇱 쇳 쇼 쇽 숀 숄 숌 숍 숏 숑 수 숙 순 숟 술 숨 숩 숫 숭
  • Row 29: 숯 숱 숲 숴 쉈 쉐 쉑 쉔 쉘 쉠 쉥 쉬 쉭 쉰 쉴 쉼 쉽 쉿 슁 슈 슉 슐 슘 슛 슝 스 슥 슨 슬 슭 슴 습 슷 승 시 식 신 싣 실 싫 심 십 싯 싱 싶 싸 싹 싻 싼 쌀 쌈 쌉 쌌 쌍 쌓 쌔 쌕 쌘 쌜 쌤 쌥 쌨 쌩 썅 써 썩 썬 썰 썲 썸 썹 썼 썽 쎄 쎈 쎌 쏀 쏘 쏙 쏜 쏟 쏠 쏢 쏨 쏩 쏭 쏴 쏵 쏸 쐈 쐐 쐤 쐬 쐰
  • Row 30: 쐴 쐼 쐽 쑈 쑤 쑥 쑨 쑬 쑴 쑵 쑹 쒀 쒔 쒜 쒸 쒼 쓩 쓰 쓱 쓴 쓸 쓺 쓿 씀 씁 씌 씐 씔 씜 씨 씩 씬 씰 씸 씹 씻 씽 아 악 안 앉 않 알 앍 앎 앓 암 압 앗 았 앙 앝 앞 애 액 앤 앨 앰 앱 앳 앴 앵 야 약 얀 얄 얇 얌 얍 얏 양 얕 얗 얘 얜 얠 얩 어 억 언 얹 얻 얼 얽 얾 엄 업 없 엇 었 엉 엊 엌 엎
  • Row 31: 에 엑 엔 엘 엠 엡 엣 엥 여 역 엮 연 열 엶 엷 염 엽 엾 엿 였 영 옅 옆 옇 예 옌 옐 옘 옙 옛 옜 오 옥 온 올 옭 옮 옰 옳 옴 옵 옷 옹 옻 와 왁 완 왈 왐 왑 왓 왔 왕 왜 왝 왠 왬 왯 왱 외 왹 왼 욀 욈 욉 욋 욍 요 욕 욘 욜 욤 욥 욧 용 우 욱 운 울 욹 욺 움 웁 웃 웅 워 웍 원 월 웜 웝 웠 웡 웨
  • Row 32: 웩 웬 웰 웸 웹 웽 위 윅 윈 윌 윔 윕 윗 윙 유 육 윤 율 윰 윱 윳 융 윷 으 윽 은 을 읊 음 읍 읏 응 읒 읓 읔 읕 읖 읗 의 읜 읠 읨 읫 이 익 인 일 읽 읾 잃 임 입 잇 있 잉 잊 잎 자 작 잔 잖 잗 잘 잚 잠 잡 잣 잤 장 잦 재 잭 잰 잴 잼 잽 잿 쟀 쟁 쟈 쟉 쟌 쟎 쟐 쟘 쟝 쟤 쟨 쟬 저 적 전 절 젊
  • Row 33: 점 접 젓 정 젖 제 젝 젠 젤 젬 젭 젯 젱 져 젼 졀 졈 졉 졌 졍 졔 조 족 존 졸 졺 좀 좁 좃 종 좆 좇 좋 좌 좍 좔 좝 좟 좡 좨 좼 좽 죄 죈 죌 죔 죕 죗 죙 죠 죡 죤 죵 주 죽 준 줄 줅 줆 줌 줍 줏 중 줘 줬 줴 쥐 쥑 쥔 쥘 쥠 쥡 쥣 쥬 쥰 쥴 쥼 즈 즉 즌 즐 즘 즙 즛 증 지 직 진 짇 질 짊 짐 집 짓
  • Row 34: 징 짖 짙 짚 짜 짝 짠 짢 짤 짧 짬 짭 짯 짰 짱 째 짹 짼 쨀 쨈 쨉 쨋 쨌 쨍 쨔 쨘 쨩 쩌 쩍 쩐 쩔 쩜 쩝 쩟 쩠 쩡 쩨 쩽 쪄 쪘 쪼 쪽 쫀 쫄 쫌 쫍 쫏 쫑 쫓 쫘 쫙 쫠 쫬 쫴 쬈 쬐 쬔 쬘 쬠 쬡 쭁 쭈 쭉 쭌 쭐 쭘 쭙 쭝 쭤 쭸 쭹 쮜 쮸 쯔 쯤 쯧 쯩 찌 찍 찐 찔 찜 찝 찡 찢 찧 차 착 찬 찮 찰 참 찹 찻
  • Row 35: 찼 창 찾 채 책 챈 챌 챔 챕 챗 챘 챙 챠 챤 챦 챨 챰 챵 처 척 천 철 첨 첩 첫 첬 청 체 첵 첸 첼 쳄 쳅 쳇 쳉 쳐 쳔 쳤 쳬 쳰 촁 초 촉 촌 촐 촘 촙 촛 총 촤 촨 촬 촹 최 쵠 쵤 쵬 쵭 쵯 쵱 쵸 춈 추 축 춘 출 춤 춥 춧 충 춰 췄 췌 췐 취 췬 췰 췸 췹 췻 췽 츄 츈 츌 츔 츙 츠 측 츤 츨 츰 츱 츳 층
  • Row 36: 치 칙 친 칟 칠 칡 침 칩 칫 칭 카 칵 칸 칼 캄 캅 캇 캉 캐 캑 캔 캘 캠 캡 캣 캤 캥 캬 캭 컁 커 컥 컨 컫 컬 컴 컵 컷 컸 컹 케 켁 켄 켈 켐 켑 켓 켕 켜 켠 켤 켬 켭 켯 켰 켱 켸 코 콕 콘 콜 콤 콥 콧 콩 콰 콱 콴 콸 쾀 쾅 쾌 쾡 쾨 쾰 쿄 쿠 쿡 쿤 쿨 쿰 쿱 쿳 쿵 쿼 퀀 퀄 퀑 퀘 퀭 퀴 퀵 퀸 퀼
  • Row 37: 큄 큅 큇 큉 큐 큔 큘 큠 크 큭 큰 클 큼 큽 킁 키 킥 킨 킬 킴 킵 킷 킹 타 탁 탄 탈 탉 탐 탑 탓 탔 탕 태 택 탠 탤 탬 탭 탯 탰 탱 탸 턍 터 턱 턴 털 턺 텀 텁 텃 텄 텅 테 텍 텐 텔 템 텝 텟 텡 텨 텬 텼 톄 톈 토 톡 톤 톨 톰 톱 톳 통 톺 톼 퇀 퇘 퇴 퇸 툇 툉 툐 투 툭 툰 툴 툼 툽 툿 퉁 퉈 퉜
  • Row 38: 퉤 튀 튁 튄 튈 튐 튑 튕 튜 튠 튤 튬 튱 트 특 튼 튿 틀 틂 틈 틉 틋 틔 틘 틜 틤 틥 티 틱 틴 틸 팀 팁 팃 팅 파 팍 팎 판 팔 팖 팜 팝 팟 팠 팡 팥 패 팩 팬 팰 팸 팹 팻 팼 팽 퍄 퍅 퍼 퍽 펀 펄 펌 펍 펏 펐 펑 페 펙 펜 펠 펨 펩 펫 펭 펴 편 펼 폄 폅 폈 평 폐 폘 폡 폣 포 폭 폰 폴 폼 폽 폿 퐁
  • Row 39: 퐈 퐝 푀 푄 표 푠 푤 푭 푯 푸 푹 푼 푿 풀 풂 품 풉 풋 풍 풔 풩 퓌 퓐 퓔 퓜 퓟 퓨 퓬 퓰 퓸 퓻 퓽 프 픈 플 픔 픕 픗 피 픽 핀 필 핌 핍 핏 핑 하 학 한 할 핥 함 합 핫 항 해 핵 핸 핼 햄 햅 햇 했 행 햐 향 허 헉 헌 헐 헒 험 헙 헛 헝 헤 헥 헨 헬 헴 헵 헷 헹 혀 혁 현 혈 혐 협 혓 혔 형 혜 혠
  • Row 40: 혤 혭 호 혹 혼 홀 홅 홈 홉 홋 홍 홑 화 확 환 활 홧 황 홰 홱 홴 횃 횅 회 획 횐 횔 횝 횟 횡 효 횬 횰 횹 횻 후 훅 훈 훌 훑 훔 훗 훙 훠 훤 훨 훰 훵 훼 훽 휀 휄 휑 휘 휙 휜 휠 휨 휩 휫 휭 휴 휵 휸 휼 흄 흇 흉 흐 흑 흔 흖 흗 흘 흙 흠 흡 흣 흥 흩 희 흰 흴 흼 흽 힁 히 힉 힌 힐 힘 힙 힛 힝

한자 세트

Johab 부호화

KS X 1001에 규정된 Johab 부호화 도표

KS X 1001은 1992년부터 Johab으로 알려진 대체 인코딩을 정의하고 있습니다.이것은 3개의 5비트 값의 시퀀스로서 한글 음절을 나타내며, 2개의 8비트 바이트로 분할되며, 최상위 비트가 첫 번째입니다.리드 바이트의 최상위 비트는 항상 설정됩니다(싱글 바이트 ASCII 또는 KS X 1003과의 조합을 허용).이 인코딩은 다른 컴포넌트의 필러 값을 사용하여 KS X 1001의 4행째의 최신 jamo에도 사용됩니다.한글의 Johab 인코딩은 아래 [25]표에 나와 있습니다.

Johab은 초기 jamo(한자의 경우 0xE0–0xF9, 한글 음절 및 현대 jamo를 제외한 비한자의 경우 0xD9[26]–0xDE)에 대응하지 않는 리드 바이트를 사용하여 KS X 1001의 나머지 바이트를 0x31–0x7E 및 0x91–[25]0xFE 범위로 인코딩합니다.이러한 코드는 문자의 KS X 1001 코드 [26]포인트에서 알고리즘으로 매핑되며 리드 바이트당 두 개의 KS X 1001 행이 있습니다(Shift JIS 비교 및 대비).

더블바이트 상태일 때 EBCDIC 기반 Johab 배리언트의 레이아웃

ASCII 베이스의 Johab 부호화에는,[27] Microsoft 에 의해서 코드 페이지 1361 의 번호가 붙여져 있습니다.예를 들어 IBM은 EBCDIC에서 Shift Out 세트로 사용하기 위해 다른 공급업체 정의 Johab 변형도 정의합니다.이 변종에서는 시프트인 및 시프트아웃사용하여 싱글바이트 EBCDIC 페이지와 Johab을 전환하고, 비항글 문자에 대해 다른 인코딩(레이아웃이 다른 리드바이트 0x40~6C 사용)을 사용하며, 사용자 정의 영역으로서 리드바이트 0xD4~DD를 사용하지만 한글 시프트에서는 1992년 표준으로 동일한 Johab 레이아웃을 사용합니다.out [28]상태IBM은 EBCDIC 기반의 상태 저장 Johab 인코딩 코드 페이지 1364에 [28]번호를 매기고, 한글 문자 수가 적지만 동일한 레이아웃에 있는 해당 인코딩[29]하위 집합을 코드 페이지 933으로 정의합니다.

삼성이나 골드스타( LG) 등 일부 공급업체는 5비트 코드와 자모의 매핑이 아래와 다른 다른 "조합" 인코딩을 사용했으며, 결과적으로 1992년 표준인 [ac]조합과 호환되지 않는다.아래 표는 1992년 표준 및 IBM 사용법에 해당합니다.

KS C 5601(/X 1001)의 한글용 Johab 코드: 1992[25]
5비트 시퀀스 처음에 모음으로 마지막으로
00000 사용하지 않음 사용하지 않음[광고] 사용하지 않음
00001 필러 사용하지 않음[애] 필러(빈 최종)
00010 필러
00011
00100
00101
00110
00111
01000 사용하지 않음[광고]
01001 사용하지 않음[애]
01010
01011
01100
01101
01110
01111
10000 사용하지 않음[광고]
10001 사용하지 않음[애]
10010 사용하지 않음
10011
10100
10101 사용하지 않음
10110 비한글 리드 바이트
10111 비한글 리드 바이트
11000 비한글 리드 바이트 사용하지 않음[광고]
11001 비한글 리드 바이트 사용하지 않음[애]
11010 비한글 리드 바이트
11011 비한글 리드 바이트
11100 비한글 리드 바이트
11101 비한글 리드 바이트
11110 비한글 리드 바이트 사용하지 않음 사용하지 않음
11111 사용하지 않음 사용하지 않음 사용하지 않음

각주

  1. ^ Korean: 정보 교환용 부호계 (한글 및 한자), romanized: Jeongbo Gyohwan'yong Buhogye (Hangeul mich Hanja)
  2. ^ a b ISO 2022 호환94n 문자 집합으로서 플레인 스페이스와 삭제 문자는 각각 0x20 및 0x7F(0xA0 및 0xFF가 아님)에서 항상 싱글 바이트 코드로 사용할 수 있습니다.
  3. ^ a b c d e f g h i 애플에 의해 ASCII 디짓, 정사각형 U+20DE 및 전용 문자 U+F87C의 [19]시퀀스에 매핑됩니다.여기에 시뮬레이션된 외관입니다.
  4. ^ a b c d e f g h i j k Apple에 의해 ASCII 시퀀스에 매핑됩니다. 괄호 안에 숫자가 있고, 그 앞에 프라이빗 유스 문자 U+F863이 [19]붙습니다.여기에 시뮬레이션된 외관입니다.
  5. ^ 0xA2D2보다 좁습니다.애플은 왕복용으로 전용 캐릭터 U+F87F를 추가했습니다.
  6. ^ 오른쪽 선이 굵은 세로 선이 2개 있습니다.Apple은 이것을 통상적인 더블 세로형 U+2016())에 덧붙여 왕복용의 전용 문자 U+F87B에 매핑 하고 있습니다.U+1D102는 의도한 외관을 반영하고 있습니다.
  7. ^ 왼쪽 선이 굵은 세로 선이 2개 있습니다.Apple은 이것을 일반적인 더블 세로형 U+2016())과 왕복 전용 문자 U+F87C에 매핑합니다. U+1D103은 의도한 외관을 반영하여 여기에 표시되어 있습니다.
  8. ^ 문자 셀의 왼쪽 하단에 정렬된 변형으로, 수평으로 사용됩니다.Apple은 이를 U+FF01+F874에 매핑합니다. U+F874는 라운드 트립을 [19]위해 Apple이 이 문자를 태그하기 위해 사용하는 개인 사용 문자입니다.최근에는 [21]추가된 변동 선택기 1(U+FE00)[22]을 사용하여 이 형식에 대해 표준화된 변동 시퀀스가 추가되었습니다.
  9. ^ 문자 셀의 왼쪽 하단에 정렬된 변형으로, 수평으로 사용됩니다.Apple은 이를 U+3002+F87D에 매핑합니다. U+F87D는 라운드 트립을 [19]위해 Apple이 이 문자를 태그하기 위해 사용하는 개인 사용 문자입니다.최근에는 [21]추가된 변동 선택기 1(U+FE00)[22]을 사용하여 이 형식에 대해 표준화된 변동 시퀀스가 추가되었습니다.
  10. ^ a b 복제, 라운드 [19]트립을 위해 개인 사용 문자 U+F87F가 추가된 Apple에 의해 매핑됩니다.
  11. ^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3257+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3257은 동그라미가 쳐지지 않은 [19]문자입니다.
  12. ^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3258+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3258은 동그라미가 쳐지지 않은 [19]문자입니다.
  13. ^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3259+에 맵F87A. 여기서 U+F87A는 전용 문자이고 U+3259는 채워지지 않은 동그라미 [19]문자입니다.
  14. ^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+325A+에 맵F87A(U+F87A는 전용 문자, U+325A는 미채움 동그라미 문자)[19]
  15. ^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3251+F87A에 매핑됩니다.U+F87A는 개인 사용 문자이고 U+3251은 채워지지 않은 동그라미 [19]문자입니다.
  16. ^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3252+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3252는 채워지지 않은 동그라미 [19]문자입니다.
  17. ^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3253+에 맵F87A. 여기서 U+F87A는 전용 문자이고 U+3253은 채워지지 않은 동그라미 [19]문자입니다.
  18. ^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3254+에 맵F87A(U+F87A는 전용 문자, U+3254는 미채움 동그라미 문자)[19]
  19. ^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3255+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3255는 동그라미가 쳐지지 않은 [19]문자입니다.
  20. ^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3256+F87A에 매핑됩니다.여기서 U+F87A는 전용 문자이고 U+3256은 동그라미가 쳐지지 않은 [19]문자입니다.
  21. ^ a b c d e f g h i j Apple에 의해 ASCII 시퀀스에 매핑되며, 프리픽스에는 프라이빗 유스 문자 U+F862가 [19]붙습니다.
  22. ^ a b c d e f g h i 애플에 의해 ASCII 디짓, 정사각형 U+20DE 및 전용 문자 U+F875의 [19]시퀀스에 매핑됩니다.여기에 시뮬레이션된 외관입니다.
  23. ^ a b c d e f g h i j k Apple에 의해 ASCII 시퀀스에 매핑됩니다. 괄호 안에 숫자가 있고, 그 앞에 프라이빗 유스 문자 U+F866이 [19]붙습니다.여기에 시뮬레이션된 외관입니다.
  24. ^ a b c d 이들은 주로 행 1에 중복된 문자입니다.Apple은 "긴" 버전으로 설명하고 라운드 트립을 위해 [19]전용 문자 U+F879를 추가합니다.
  25. ^ a b c d 또한 MacKorean 인코딩에는 KS X 1001 플레인 범위 밖에 있는 다양한 스타일의 화살표 세트(흰색 화살표 포함)가 포함되어 있으며 리드 바이트는 0xA8과 0xAC, 트레일 바이트는 0x41과 0xA0 사이입니다.Apple은 라운드 트립을 [19]위해 이 흰색 화살표 세트에 전용 문자 U+F878을 추가합니다.
  26. ^ a b 1행의 표시와 달리 이 두 마크는 낮은 위치(U+301F와 유사)에 표시되도록 되어 있습니다.Apple은 이를 [19]구별하기 위해 개인 사용 문자 U+F873을 추가합니다.
  27. ^ Apple은 이것을 U+21E7+F87F에 매핑합니다.여기서 U+21E7은 흰색 위쪽[19] 화살표이고 U+F87F는 개인 사용 문자이지만 이 문자는 검은색 [24]화살표입니다.표시된 문자는 Apple의 맵핑 테이블을 후술하는 유니코드 문자로, 이 Mac Korean 문자의 문자와[24] 유사합니다.
  28. ^ Apple은 이를 일련의 ASCII 느낌표와 그 뒤에 개인 사용 문자 U+F87F에 [19]매핑합니다.
  29. ^ 이러한 인코딩에 대한 매핑은 여기서 사용할 수 있습니다.
  30. ^ a b c d 이것을 사용하는 경우, C0 제어 코드 범위의 트레일 바이트가 됩니다.
  31. ^ a b c d 이것을 사용하면 ASCII의 0x2_ 행과 0x3_ 행에 트레일 바이트가 생성됩니다.Johab은 대부분의 일반적인 레거시 CJK 인코딩(Shift JIS, GBK, Big5)과 마찬가지로 트레일 바이트에 0x2_ 행을 사용하지 않습니다.EBCDIC 기반 버전의 Johab은 EBCDIC 제어 코드 범위에 있으므로 어느 행의 추적 바이트도 사용하지 않습니다.

레퍼런스

  1. ^ a b c d e Lunde, Ken (2009). "Chapter 3: Character Set Standards". CJKV Information Processing. p. 143-148. ISBN 978-0596514471.
  2. ^ a b c d e f Hwang, Jinsang (2005). The Social Shaping of ICTs Standards: A Case of National Coded Character Set Standards Controversy in Korea (PDF). University of Edinburgh.
  3. ^ a b c Lunde, Ken (1995-12-18). "2.4.6: Obsolete Standards". CJK.INF Version 1.9.
  4. ^ a b Shin, Jungshik. "What are KS X 1001(KS C 5601) and other Hangul codes?". Hangul & Internet in Korea FAQ.
  5. ^ a b c d Lunde, Ken (1995-12-18). "3.3.6: N-byte Hangul". CJK.INF Version 1.9.
  6. ^ a b "INFO: Hangul (Korean) Character Sets", Microsoft Support, Microsoft
  7. ^ a b Zsigri, Gyula (2002-06-18). "KSC and UHC".
  8. ^ Chang, Hye-Shik (28 November 2021). "cpython/Modules/cjkcodecs/_codecs_kr.c (revision d3faf43)". cPython source tree. Python Software Foundation.
  9. ^ a b c Chung, Jaemin (2017-03-30). Proposal to add an informative note to U+3164 HANGUL FILLER (PDF). Unicode Consortium. UTC L2/17-081.
  10. ^ "Code Page 01040" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
  11. ^ "Code Page 00891" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
  12. ^ "KSRI-87-37-IR: 항을・한자 코드 표준화에 관한 예연구: A Study on Standardization of Hangul and Hanja Codes" (PDF) (in Korean). Ministry of Science and Technology. 1987. p. 68. Archived from the original (PDF) on 2019-03-01.
  13. ^ "ibm-1363_P110-1997 (lead byte A1)". ICU Demonstration - Converter Explorer. International Components for Unicode / Unicode Consortium.
  14. ^ "euc-kr (lead byte A1)". ICU Demonstration - Converter Explorer. International Components for Unicode.
  15. ^ a b c d "Map (external version) from Mac OS Korean encoding to Unicode 3.2 and later". Apple.
  16. ^ "windows-949-2000 (lead byte A1)". ICU Demonstration - Converter Explorer. International Components for Unicode / Unicode Consortium.
  17. ^ a b c d "Lead Byte A1-A2 (Code page 949)". MSDN. Microsoft.
  18. ^ Korea Bureau of Standards (1988-10-01). Korean Graphic Character Set for Information Interchange (PDF). ITSCJ/IPSJ. ISO-IR-149.
  19. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae Apple (2005-04-05). "Map (external version) from Mac OS Korean encoding to Unicode 3.2 and later". Unicode Consortium.
  20. ^ "windows-949-2000 (lead byte A2)". ICU Demonstration - Converter Explorer. International Components for Unicode / Unicode Consortium.
  21. ^ a b Lunde, Ken (2018-01-21). "Proposal to add standardized variation sequences for fullwidth East Asian punctuation" (PDF). UTC L2/17-436.
  22. ^ a b "StandardizedVariants.txt: Standardized Variation Sequences". Unicode Character Database. Unicode Consortium.
  23. ^ Lunde, Ken (2009). "Seemingly Missing Characters". CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. p. 180. ISBN 978-0-596-51447-1.
  24. ^ a b Lunde, Ken (2009). "Appendix E: Vendor Character Set Standards" (PDF). CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. ISBN 978-0-596-51447-1.
  25. ^ a b c Lunde, Ken (2008). "Chapter 4: Encoding Methods (§ Johab Encoding—KS X 1001:2004)". CJKV Information Processing (2nd ed.). Sebastopol, California: O'Reilly Media. pp. 268–273. ISBN 978-0-596-51447-1.
  26. ^ a b Shin, Jungshik (2011-10-14) [1999-08-16]. Johab to Unicode table. Unicode Consortium.
  27. ^ "Code Page Identifiers". Windows Dev Center. Microsoft.
  28. ^ a b "ibm-1364_P110-2007". International Components for Unicode. Unicode Consortium.
  29. ^ "ibm-933_P110-1995". International Components for Unicode. Unicode Consortium.

외부 링크