KS X 1001

KS X 1001
MIME / IANA	ks_c_5601-1991
에일리어스	KS C 5601
언어	한국어, 영어, 러시아어, 불가리아어, 이누크티투트(라틴어); 부분 지원:; 그리스어, 일본어, 덴마크어, 노르웨이어 등
표준.	KS X 1001
분류	ISO-2022 호환 DBCS, CJK 인코딩
인코딩 형식	EUC-KR, ISO 2022, UHC, Johab
선행	N바이트 한글 코드(KS C 5601-1974)
기타 관련 부호화	KS X 1002, KPS 9566, JIS X 0208, GB 2312, GB 12052
	v; t;

KS X 1001, "정보교환용 코드(한글과 한자)"^[a]^[1]는 한글과 한자를 컴퓨터 상에서 표현하기 위한 한글 코드 세트 표준이다.

KS X 1001은 EUC-KR 및 마이크로소프트의 통합 한글 코드(UHC)를 포함하여 가장 일반적인 한글(Unicode 이전) 문자 인코딩으로 인코딩됩니다.한글 음절, CJK 한자, 그리스어, 키릴어, 일본어, 히라가나, 가타카나 등의 문자가 포함되어 있다.

KS X 1001은 ISO 2022 및 EUC의 2바이트 코드워드 구조에 따라 94×94 테이블로 배열되어 있습니다.따라서 코드 포인트는 1 ~94의 정수 쌍입니다.그러나 일부 인코딩(UHC 및 Johab)은 모든 코드 포인트에 대한 코드를 제공할 뿐만 아니라 코드 포인트 시퀀스로만 표시될 수 있는 문자에 대한 추가 코드를 제공합니다.

역사

이 표준은 이전에는 KS C 5601로 알려져 있었습니다.이 기준에는 몇 가지 개정이 있었다.예를 들어 1987년, 1992년, 1998년 및 2002년에 개정안이 있었다.

현재의 더블바이트 완성 문자 집합은 ^[3]1986년에 발간된 ^[1]KS C 5601 ^[2]제3판을 통해 표준화되었다.ISO 2022와 호환되지 않지만 현대 자모를 사용하여 모든 한글 음절에 2바이트 코드를 할당하는 것과 달리, 비한글,^[1] 한글 자모 ^[2]및 가장 일반적인 한글 음절에 2바이트 코드를 할당하는 ISO 2022 호환 인코딩이다.완성은 기술적으로 가변 길이 인코딩으로 다른 음절을 (자모 및 한글 필러 문자를 사용하여) 8바이트 시퀀스로 나타낼 수 있지만 이 기능이 항상 ^[4]구현되는 것은 아닙니다.

1974년에 ^[2]발행된 KS C 5601의 초기 판은 가변 길이^[2] 7비트 문자 집합을 정의하여 JIS C 6220과 다소 유사한 51개의 기본 한글 ^[5]자모에 싱글^[3] 바이트 코드 포인트를 할당하였다.1982년에 출판된 제2판은 1974년판부터의 주인공 세트를 유지했지만, Johab 버전을 포함한 두 개의 보충 세트를 정의했다.어느 판도 ^[2]의도한 만큼 널리 채택되지 않았다.

완성은 1987년과 1992년 판에서도 변하지 않았다.1992년 판에서는 부속서 3의 조합^[6] 부호화 정의와 부속서 ^[1]^[5]4의 구형 N바이트 한글 부호화 정의를 포함한 부속서 자료가 ^[3]추가되었다.당시 한글 워드프로세서가 사용하던 완성에 대한 경쟁 인코딩으로 산업계가 조합(Johab)을 사용한 것에 대응하여 발행되었다.마이크로소프트가 윈도우 95에서 통합 한글 코드를 도입하고, 2000년 한글 워드 프로세서가 유니코드를 위해 조합을 포기하면서, ^[2]조합은 일반적으로 사용되지 않게 되었다.

인코딩

(A screenshot of an old version of Firefox showing Big5, GB2312, GBK, GB18030, HZ, ISO-2022-CN, Big5-HKSCS, EUC-TW, EUC-JP, ISO-2022-JP, Shift_JIS, EUC-KR, UHC, Johab and ISO-2022-KR as available encodings under the CJK sub-menu.)

2004년 현재 Mozilla Firefox에 의해 지원되는 KS X 1001 기반의 4개의 CJK 인코딩(이 지원은 특정 사이트 간 스크립팅 공격을 피하기 위해 이후 버전에서 축소되었습니다.)

KS X 1001의 부호화 방식에는 EUC-KR(ASCII 및 ISO 646-KR 베이스의 바리안트, 후자는 백슬래시가 아닌 0x5C 바이트의 원화 기호())를 포함한다), ISO-2022-KR(^[7]JIS 022-JP-2 및 0220 XJIS도 부호화한다)가 있습니다.이들은 모두 자체 KS X 1001 코드포인트(전체 11172개 중 구식 자모를 사용하지 않음)를 가진 2350개의 사전 구성 한글 음절에만 코드를 할당하고, 다른 사람들은 8바이트 구성 시퀀스를 사용하도록 요구한다는 단점이 있는데,^[4] 이는 일부 표준 구현에서는 지원되지 않습니다.

Johab 부호화(1992년판 표준 부속서 3에 기재)와 통합 한글 코드(UHC, Windows-949)로 알려진 EUC-KR 슈퍼셋은 모든 11172 한글 ^[7]^[6]음절에 대해 단일 코드를 제공합니다.ISO-2022-KR 및 Johab은 거의 사용되지 않습니다.일부 운영 체제는 이 표준을 다른 비균일한 방식으로 확장합니다. 예를 들어, 기존 Mac OS의 EUC-KR 확장 MacKorean 및 IBM의 IBM-949가 이에 해당합니다.

한글 필러

한글 필러 문자는 8바이트 한글 구성^[8]^[9] 시퀀스를 소개하고 이러한 ^[9]시퀀스에서 누락된 요소(일반적으로 빈 최종 요소)를 대신하기 위해 사용됩니다.

유니코드는 왕복 호환성을 위해 한글 호환성 자모 블록에 완성코드 한글 필러를 포함하지만 한글 작성에는 자체 시스템(필러 문자)을 사용한다.KS X 1001 한글 구성 체계는 유니코드에서는 사용되지 않으며, 필러는 빈 공간으로 렌더링됩니다. 현대 자모를 사용한 KS X 1001 구성 시퀀스는 유니코드 ^[9]사전 구성 문자에 매핑될 수 있습니다.이것은 보통 통일 한글 코드에서는 행해지지 않습니다.

왕복 호환성을 위해 Unicode는 "Halfwidth and Fullwidth Forms" 블록에 N바이트 한글 코드 한글 필러를 별도로 포함합니다.

N바이트 한글 코드

이는 KS C 5601-1974 및 KS C 5601-1992의 부속서 4에 명시된 N바이트 한글 ^[5]코드입니다.IBM의 코드 페이지^[10] 1040의 후반부는 이 중 상위 집합으로, 문자를 할당합니다.¢¬\~(단, 아닙니다만)£코드 페이지 1041과 동일한 위치에 있는 반면 확장되지 않은 N바이트 한글(일부 사용 컨텍스트에서 C0 제어 코드 대체 그래픽을 제외하고 IBM-1040과 공유됨)은 코드 페이지 891입니다.^[11]문자 0x40/0xC0은 시퀀스 조합에 사용되는 한글 필러(상기 참조)입니다.

일본의 JIS C6220(JIS X 0201)과 마찬가지로 N바이트 한글 코드를 7비트 인코딩으로 사용할 수 있으며 ^[5]0x40~0x7C 범위의 문자를 할당할 수 있습니다.다음 표는 코드 페이지 891 또는 1040에서 사용되는 것과 같이 높은 비트 설정(0xC0 ~ 0xFC 이상)이 있는 8비트 환경의 코드를 보여 줍니다.

KS C 5601-1974 / N바이트^[12] 한글
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
8배
9배
도끼
Bx
Cx	HWHF	ﾡ	ﾢ	ﾣ	ﾤ	ﾥ	ﾦ	ﾧ	ﾨ	ﾩ	ﾪ	ﾫ	ﾬ	ﾭ	ﾮ	ﾯ
Dx	ﾰ	ﾱ	ﾲ	ﾳ	ﾴ	ﾵ	ﾶ	ﾷ	ﾸ	ﾹ	ﾺ	ﾻ	ﾼ	ﾽ	ﾾ
예			ￂ	ￃ	ￄ	ￅ	ￆ	ￇ			ￊ	ￋ	ￌ	ￍ	ￎ	ￏ
Fx			ￒ	ￓ	ￔ	ￕ	ￖ	ￗ			ￚ	ￛ	ￜ

완성코드 차트

완성 레이아웃의 KS X 1001 코드 차트는 다음과 같습니다.16 진수의 페어가 지정되어 있는 경우는, 한국어 세트가 ISO-2022-KR 로 이행했을 때와 같이, GL(0x21-0x7E) 경유로 부호화되는 경우는, 작은 것이, EUC-KR 또는 UHC 로 부호화되는 경우는, 보다 일반적인 경우(0xA1-0xFE)로 부호화되는 경우는, 큰 것이 사용됩니다.조합은 11172개의 한글 군집을 개별적으로 순서대로 인코딩하도록 배열을 변경합니다.

벤더의 구현의 차이를 설명하기 위해 일부 문자에 대해 여러 Unicode 매핑을 보여 줍니다.Wansung 플레인에 대한 Apple의 한글 Talk 확장자(즉, 양쪽 바이트가 0xA1-0xFE 범위)가 표시되지만 다른 한글 Talk 확장자 범위는 표시되지 않습니다.통합 한글 코드의 합성 음절에 대한 추가 코드와 IBM-949의 IBM 확장자 또한 둘 다 완성 평면 밖에 있기 때문에 표시되지 않는다.

리드 바이트

KS X 1001 (완성코드)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배	SP^[b]	1-_	2-_	3-_	4-_	5-_	6-_	7-_	8-_	9-_	10-_	11-_	12-_	13-_	14-_	15-_
3배/B배	16-_	17-_	18-_	19-_	20-_	21-_	22-_	23-_	24-_	25-_	26-_	27-_	28-_	29-_	30-_	31-_
4배속/Cx	32-_	33-_	34-_	35-_	36-_	37-_	38-_	39-_	40-_	41-_	42-_	43-_	44-_	45-_	46-_	47-_
5배속/깊이	48-_	49-_	50-_	51-_	52-_	53-_	54-_	55-_	56-_	57-_	58-_	59-_	60-_	61-_	62-_	63-_
6배속/Ex	64-_	65-_	66-_	67-_	68-_	69-_	70-_	71-_	72-_	73-_	74-_	75-_	76-_	77-_	78-_	79-_
7x/Fx	80-_	81-_	82-_	83-_	84-_	85-_	86-_	87-_	88-_	89-_	90-_	91-_	92-_	93-_	94-_	델^[b]

비한자 사전 구성 집합

문자 집합 0x21 / 0xA1(1행, 특수 문자)

이 집합에는 KS X 1003(3행에 포함)에 있는 구두점을 제외한 구두점 및 기타 기호가 포함됩니다.KS X 1001을 싱글바이트 ASCII와 조합하는 인코딩에서는 백슬래시에 대해 하프폭 및 풀폭 폼블록에 대한 대체 유니코드 매핑을 사용할 수 있습니다.Wave Dash(칠데 대시)의 Unicode 매핑도 벤더마다 다르며 U+301C(IBM ^[13]^[14]^[15]및 Apple에서 제공) 또는 U+223C(Microsoft에서 ^[16]^[17]제공)가 될 수 있습니다.JIS 웨이브 대시와 다음 줄의 칠데의 취급을 비교합니다.

백슬래시를 제외하고 아래에 2개의 매핑이 표시되어 있는 경우 첫 번째 매핑은 Apple에 의해 사용되고 두 번째 매핑은 Microsoft에 ^[15]^[17]의해 사용됩니다.

KS X 1001 (0x21 / 0xA1로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		IDSP	、	。	·	‥	…	¨	〃	부끄럽다	-/-	‖ / ∥∥	\/contractions.\/contractions(표준)	〜/∼	‘	’
3배/B배	“	”	〔	〕	〈	〉	《	》	「	」	『	』	【	】	±	×
4배속/Cx	÷	≠	≤	≥	∞	∴	°	′	″	℃	Å	¢ / ￠￠	파운드/파운드	¥ / ￥￥	♂	♀
5배속/깊이	∠	⊥	⌒	∂	∇	≡	≒	§	※	☆	★	○	●	◎	◇	◆
6배속/Ex	□	■	△	▲	▽	▼	→	←	↑	↓	↔	〓	≪	≫	√	∽
7x/Fx	∝	∵	∫	∬	∈	∋	⊆	⊇	⊂	⊃	∪	∩	∧	∨	¬ / ￢

문자 집합 0x22 / 0xA2(2행, 특수 문자)

이 세트에는 추가 구두점과 기호가 포함되어 있습니다.이전 행의 칠데 문자와 마찬가지로 이 행의 칠데 문자(Apple에서는 U+02DC,^[15]^[17] Microsoft에서는 FF5E)에 대해 다른 매핑이 사용되며, 이전 행의 칠데는 대시 ^[18]높이로 인라인으로 표시됩니다.동그라미가 쳐진 점의 ^[15]^[17]매핑도 다릅니다.

유로화와 등록 상표 표기는 1998년에 표준으로 추가되었고,^[1] 한국 우편 마크())는 2002년에 추가되었다.이들 3개의 코드 포인트는 아직 사용되지 않은 코드 포인트와 마찬가지로 벤더에 의해 다른 ^[19]비표준적인 목적으로 사용되고 있습니다.예를 들어 Apple의 박스형 리스트 마커에 사용됩니다.MS는 1998년 유로화를 포함한 추가사항을 추가하기 위해 통일 한글 코드 시행을 업데이트했지만,^[20] 표준에 추가될 때는 한글 마크를 추가하지 않았다.

KS X 1001 (0x22 / 0xA2로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		⇒	⇔	∀	∃	´	//~	ˇ	˘	˝	˚	˙	¸	˛	¡	¿
3배/B배	ː	∮	∑	∏	¤	℉	‰	◁	◀	▷	▶	♤	♠	♡	♥	♧
4배속/Cx	♣	◉ / ⊙	◈	▣	◐	◑	▒	▤	▥	▨	▧	▦	▩	♨	☏	☎
5배속/깊이	☜	☞		†	‡	↕	↗	↙	↖	↘	♭	♩	♪	♬	㉿	㈜
6배속/Ex	№	㏇	™	㏂	㏘	℡	1파운드당 €^[c]	®/2개^[c]	3분의 1^[c]	4인치^[c]	5인치^[c]	6인치^[c]	7인치^[c]	8인치^[c]	9인치^[c]	[10]^[d]
7x/Fx	[11]^[d]	[12]^[d]	[13]^[d]	[14]^[d]	[15]^[d]	[16]^[d]	[17]^[d]	[18]^[d]	[19]^[d]	[20]^[d]	^[e]	𝄂^[f]	𝄃^[g]	⋮	∷
Apple에 의한 추가 정보 Apple의 추가 기능과 충돌하는 최신 표준 추가

문자 집합 0x23/0xA3(3행 번호, 기본 라틴어/ISO 646-KR)

이 세트는 KS X 1003(한국어의 ISO 646 변형, ASCII와 유사한 세트)에 대응하지만 2바이트 코드 앞에 0x23(또는 GR 위임(EUC) 형식의 0xA3)이 붙습니다.영어 알파벳/기본 라틴 알파벳, 아랍어 서부 숫자 및 구두점이 포함됩니다.

JIS X 0201의 로마식 세트를 비교해 보십시오.이것은 원 기호 대신 엔 기호를 포함하는 것으로 다릅니다.ISO 646 레이아웃에 따르지만 문자와 숫자만 포함하는 KPS 9566 및 JIS X 0208의 세 번째 행과 대조합니다.

KS X 1001(0x23/0xA3으로 프리픽스), 비전폭 매핑
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		!	"	#	$	%	&	'	(	)	*	+	,	-	.	/
3배/B배	0	1	2	3	4	5	6	7	8	9	:	;	< >	=	>	?
4배속/Cx	@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
5배속/깊이	P	Q	R	S	T	U	V	W	X	Y	Z	[	₩	]	^	_
6배속/Ex	`	a	b	c	d	e	f	g	h	i	j	k	l	m	n	o
7x/Fx	p	q	r	s	t	u	v	w	x	y	z	{		}	‾

EUC-KR 및 UHC 등의 인코딩은 KS X 1001을 싱글바이트 ASCII 또는 KS X 1003과 결합하기 때문에 이러한 문자를 더블바이트로 표현하기 위해 Halfwidth 및 Fullwidth Forms 블록에 대한 대체 Unicode 매핑을 사용합니다.

KS X 1001(0x23/0xA3으로 프리픽스), 전폭 매핑
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		！	＂	＃	＄	％	＆	＇	（	）	＊	＋	，	－	．	／
3배/B배	０	１	２	３	４	５	６	７	８	９	：	；	＜	＝	＞	？
4배속/Cx	＠	A.	B.	C.	D.	E.	에프	Ｇ	Ｈ	나	J.	K.	Ｌ	Ｍ	Ｎ	오
5배속/깊이	P.	질문	Ｒ	S.	T.	Ｕ	브이	Ｗ	X.	Y.	Ｚ	［	￦	］	＾	＿
6배속/Ex	｀	1개	b.	c.	ｄ	이	에프	ᄀ	ｈ	아이	ｊ	ｋ	ｌ	마	ｎ	ｏ
7x/Fx	p.	ｑ	ｒ	s.	t.	ｕ	V	ｗ	x.	y.	ｚ	｛	｜	｝	￣

문자 집합 0x24 / 0xA4 (4행, 한글 자모)

이 세트에는 현대 한글 자음, 모음, 남한 대조 세관에 의해 순서가 매겨진 모음, 그리고 사용되지 않는 자음이 포함되어 있습니다.이러한 문자를 개별적으로 사용하는 경우 유니코드 한글 호환성 자모 블록에 매핑되며 한글 자모 블록의 위치별 문자와의 일대일 매핑은 없습니다.북한의 KPS 9566의 4열과 비교해 보십시오.문자 04-52는 시퀀스 조합에 사용되는 한글 필러(위 참조)입니다.

KS X 1001 (0x24 / 0xA4로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		ㄱ	ㄲ	ㄳ	ㄴ	ㄵ	ㄶ	ㄷ	ㄸ	ㄹ	ㄺ	ㄻ	ㄼ	ㄽ	ㄾ	ㄿ
3배/B배	ㅀ	ㅁ	ㅂ	ㅃ	ㅄ	ㅅ	ㅆ	ㅇ	ㅈ	ㅉ	ㅊ	ㅋ	ㅌ	ㅍ	ㅎ	ㅏ
4배속/Cx	ㅐ	ㅑ	ㅒ	ㅓ	ㅔ	ㅕ	ㅖ	ㅗ	ㅘ	ㅙ	ㅚ	ㅛ	ㅜ	ㅝ	ㅞ	ㅟ
5배속/깊이	ㅠ	ㅡ	ㅢ	ㅣ	고주파	ㅥ	ㅦ	ㅧ	ㅨ	ㅩ	ㅪ	ㅫ	ㅬ	ㅭ	ㅮ	ㅯ
6배속/Ex	ㅰ	ㅱ	ㅲ	ㅳ	ㅴ	ㅵ	ㅶ	ㅷ	ㅸ	ㅹ	ㅺ	ㅻ	ㅼ	ㅽ	ㅾ	ㅿ
7x/Fx	ㆀ	ㆁ	ㆂ	ㆃ	ㆄ	ㆅ	ㆆ	ㆇ	ㆈ	ㆉ	ㆊ	ㆋ	ㆌ	ㆍ	ㆎ

문자 집합 0x25 / 0xA5 (5행, 로마 숫자 및 그리스어)

이 세트에는 로마 숫자와 그리스 알파벳에 대한 기본 지원이 포함되어 있으며, 분음 부호나 마지막 시그마 없이 사용할 수 있습니다.Apple은 ^[19]이 행에 구두점을 추가하고 6행에서 이어지는 검은색 동그라미 목록 마커를 포함합니다.

KPS 9566의 대조행 6은 같은 문자를 포함하지만 레이아웃은 다릅니다.

KS X 1001 (0x25 / 0xA5로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		ⅰ	ⅱ	ⅲ	ⅳ	ⅴ	ⅵ	ⅶ	ⅷ	ⅸ	ⅹ
3배/B배	Ⅰ	Ⅱ	Ⅲ	Ⅳ	Ⅴ	Ⅵ	Ⅶ	Ⅷ	Ⅸ	Ⅹ
4배속/Cx		알파	β	Γ	Δ	Ε	Ζ	Η	Θ	Ι	Κ	Λ	마이크로미터	Ν	Ξ	ο
5배속/깊이	Π	Ρ	Σ	Τ	Υ	Φ	Χ	Ψ	Ω		！︀^[h]	。︀^[i]	′^[j]	″^[j]	‴
6배속/Ex		α	β	γ	δ	ε	ζ	η	θ	ι	κ	λ	μ	ν	ξ	opus
7x/Fx	π	ρ	σ	τ	υ	φ	χ	ψ	ω	(27)^[k]	(28)^[l]	(29)^[m]	(30)^[n]
Apple에 의한 추가 정보

문자 집합 0x26 / 0xA6(6행, 상자 그리기)

이 행에는 반문맥에서 상자를 그리기 위한 문자가 포함되어 있습니다.Apple은 또한 검은색 동그라미 목록 ^[19]마커를 포함합니다.

KS X 1001 (0x26 / 0xA6으로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		─	│	┌	┐	┘	└	├	┬	┤	┴	┼	━	┃	┏	┓
3배/B배	┛	┗	┣	┳	┫	┻	╋	┠	┯	┨	┷	┿	┝	┰	┥	┸
4배속/Cx	╂	┒	┑	┚	┙	┖	┕	┎	┍	┞	┟	┡	┢	┦	┧	┩
5배속/깊이	┪	┭	┮	┱	┲	┵	┶	┹	┺	┽	┾	╀	╁	╃	╄	╅
6배속/Ex	╆	╇	╈	╉	╊	❶	❷	❸	❹	❺	❻	❼	❽	❾	❿	⓫
7x/Fx	⓬	⓭	⓮	⓯	⓰	⓱	⓲	⓳	⓴	(21)^[o]	(22)^[p]	(23)^[q]	(24)^[r]	(25)^[s]	(26)^[t]
Apple에 의한 추가 정보

문자 집합 0x27/0xA7(7행 번호, 단위 기호)

이 행에는 여러 문자로 구성된 단위 기호가 단일 문자로 포함됩니다.Apple은 또한 ^[19]8행에서 이어지는 동그라미 목록 마커를 포함합니다.

KPS 9566의 8행에 포함된 단위 기호 레퍼토리와 비교 및 대조합니다.

KS X 1001 (0x27 / 0xA7로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		㎕	㎖	㎗	ℓ	㎘	㏄	㎣	㎤	㎥	㎦	㎙	㎚	㎛	㎜	㎝
3배/B배	㎞	㎟	㎠	㎡	㎢	㏊	㎍	㎎	㎏	㏏	㎈	㎉	㏈	㎧	㎨	㎰
4배속/Cx	㎱	㎲	㎳	㎴	㎵	㎶	㎷	㎸	㎹	㎀	㎁	㎂	㎃	㎄	㎺	㎻
5배속/깊이	㎼	㎽	㎾	㎿	㎐	㎑	㎒	㎓	㎔	Ω	㏀	㏁	㎊	㎋	㎌	㏖
6배속/Ex	㏅	㎭	㎮	㎯	㏛	㎩	㎪	㎫	㎬	㏝	㏐	㏓	㏃	㏉	㏜	㏆
7x/Fx	⑯	⑰	⑱	⑲	⑳	㉑	㉒	㉓	㉔	㉕	㉖	㉗	㉘	㉙	㉚
Apple에 의한 추가 정보

문자 집합 0x28 / 0xA8(8행 번호, 확장 라틴어, 동그라미, 분수)

KS X 1001 (0x28 / 0xA8로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		ᄋ	ð	ª	Ħ		Ĳ		Ŀ	ł	ø	Œ	º	Þ	Ŧ	Ŋ
3배/B배		㉠	㉡	㉢	㉣	㉤	㉥	㉦	㉧	㉨	㉩	㉪	㉫	㉬	㉭	㉮
4배속/Cx	㉯	㉰	㉱	㉲	㉳	㉴	㉵	㉶	㉷	㉸	㉹	㉺	㉻	ⓐ	ⓑ	ⓒ
5배속/깊이	ⓓ	ⓔ	ⓕ	ⓖ	ⓗ	ⓘ	ⓙ	ⓚ	ⓛ	ⓜ	ⓝ	ⓞ	ⓟ	ⓠ	ⓡ	ⓢ
6배속/Ex	ⓣ	ⓤ	ⓥ	ⓦ	ⓧ	ⓨ	ⓩ	①	②	③	④	⑤	⑥	⑦	⑧	⑨
7x/Fx	⑩	⑪	⑫	⑬	⑭	⑮	½	⅓	⅔	¼	¾	⅛	⅜	⅝	⅞

문자 집합 0x29 / 0xA9(9행 번호, 확장 라틴어, 동그라미, 위첨자 및 아래첨자)

KS X 1001 (0x29/0xA9로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		æ	ᄃ	ð	ħ	ı	ĳ	ĸ	ŀ	ł	ø	œ	ß	þ	ŧ	ŋ
3배/B배	ŉ	㈀	㈁	㈂	㈃	㈄	㈅	㈆	㈇	㈈	㈉	㈊	㈋	㈌	㈍	㈎
4배속/Cx	㈏	㈐	㈑	㈒	㈓	㈔	㈕	㈖	㈗	㈘	㈙	㈚	㈛	⒜	⒝	⒞
5배속/깊이	⒟	⒠	⒡	⒢	⒣	⒤	⒥	⒦	⒧	⒨	⒩	⒪	⒫	⒬	⒭	⒮
6배속/Ex	⒯	⒰	⒱	⒲	⒳	⒴	⒵	⑴	⑵	⑶	⑷	⑸	⑹	⑺	⑻	⑼
7x/Fx	⑽	⑾	⑿	⒀	⒁	⒂	¹	²	³	⁴	ⁿ	₁	₂	₃	₄

문자 집합 0x2A/0xAA(10행, 히라가나)

이 세트에는 일본어 표기용 히라가나가 포함되어 있습니다.Apple은 또한 ^[19]9행에서 이어지는 괄호로 묶인 목록 마커를 포함합니다.

같은 레이아웃을 사용하는 KPS 9566의 10열을 비교합니다.JIS X 0208의 4행도 같은 레이아웃이지만 다른 행으로 비교 및 대조합니다.

KS X 1001(0x2A/0xAA로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		ぁ	あ	ぃ	い	ぅ	う	ぇ	え	ぉ	お	か	が	き	ぎ	く
3배/B배	ぐ	け	げ	こ	ご	さ	ざ	し	じ	す	ず	せ	ぜ	そ	ぞ	た
4배속/Cx	だ	ち	ぢ	っ	つ	づ	て	で	と	ど	な	に	ぬ	ね	の	は
5배속/깊이	ば	ぱ	ひ	び	ぴ	ふ	ぶ	ぷ	へ	べ	ぺ	ほ	ぼ	ぽ	ま	み
6배속/Ex	む	め	も	ゃ	や	ゅ	ゆ	ょ	よ	ら	り	る	れ	ろ	ゎ	わ
7x/Fx	ゐ	ゑ	を	ん	⒃	⒄	⒅	⒆	⒇	(21)^[u]	(22)^[u]	(23)^[u]	(24)^[u]	(25)^[u]	(26)^[u]
Apple에 의한 추가 정보

문자 집합 0x2B / 0xAB (11행, 가타카나)

이 세트에는 일본어 표기용 가타카나가 포함되어 있습니다.단, JIS X 0208의 1행에 포함되는 가타카나 텍스트에 사용되는 일본어 장모음 표기는 ^[23]포함되지 않습니다.Apple은 또한 9행과 ^[19]10행에 이어지는 괄호로 묶인 목록 마커를 포함합니다.

같은 레이아웃을 사용하는 KPS 9566의 11열을 비교합니다.JIS X 0208의 행 5를 비교하고 대조합니다.이 행은 같은 레이아웃이지만 다른 행으로 되어 있습니다.

KS X 1001(0x2B/0xAB로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		ァ	ア	ィ	イ	ゥ	ウ	ェ	エ	ォ	オ	カ	ガ	キ	ギ	ク
3배/B배	グ	ケ	ゲ	コ	ゴ	サ	ザ	シ	ジ	ス	ズ	セ	ゼ	ソ	ゾ	タ
4배속/Cx	ダ	チ	ヂ	ッ	ツ	ヅ	テ	デ	ト	ド	ナ	ニ	ヌ	ネ	ノ	ハ
5배속/깊이	バ	パ	ヒ	ビ	ピ	フ	ブ	プ	ヘ	ベ	ペ	ホ	ボ	ポ	マ	ミ
6배속/Ex	ム	メ	モ	ャ	ヤ	ュ	ユ	ョ	ヨ	ラ	リ	ル	レ	ロ	ヮ	ワ
7x/Fx	ヰ	ヱ	ヲ	ン	ヴ	ヵ	ヶ	(27)^[u]	(28)^[u]	(29)^[u]	(30)^[u]
Apple에 의한 추가 정보

문자 집합 0x2C/0xAC(행 번호 12, 키릴 문자)

이 세트는 현대 러시아어 알파벳을 포함하고 있으며, 키릴 문자의 다른 형식을 나타내기에는 반드시 충분하지 않습니다.애플은 또한 블랙박스 목록 ^[19]마커를 포함하고 있다.

같은 레이아웃(다른 행)을 사용하는 KPS 9566의 5행과 JIS X 0208의 7행을 비교합니다.

KS X 1001 (0x2C/0xAC로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		А	Б	В	Г	Д	Е	Ё	Ж	З	И	Й	К	Л	М	Н
3배/B배	О	П	Р	С	Т	У	Ф	Х	Ц	Ч	Ш	Щ	Ъ	Ы	Ь	Э
4배속/Cx	Ю	Я	1인치^[v]	2인치^[v]	3인치^[v]	4인치^[v]	5인치^[v]	6인치^[v]	7인치^[v]	8인치^[v]	9인치^[v]	[10]^[w]	[11]^[w]	[12]^[w]	[13]^[w]	[14]^[w]
5배속/깊이	[15]^[w]	а	б	в	г	д	е	ё	ж	з	и	й	к	л	м	н
6배속/Ex	о	п	р	с	т	у	ф	х	ц	ч	ш	щ	ъ	ы	ь	э
7x/Fx	ю	я	[16]^[w]	[17]^[w]	[18]^[w]	[19]^[w]	[20]^[w]
Apple에 의한 추가 정보

확장 문자 집합 0x2D/0xAD(행 번호 13, Apple 추가 구두점)

KS X 1001에 Apple 추가(0x2D/^[19]0xAD로 프리픽스)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
축당 2배		「^[x]	」^[x]	『^[x]	』^[x]	⇨^[y]	⇦^[y]	⇧^[y]	⇩^[y]	〞	〟	‶	″^[z]	‵	′^[z]	🠩^{[아아아아아아아아아아아아아아아아아아]}
3배/B배	!^[ab]

사전 구성 한글 세트(16~40행)

미리 구성된 한글용 코드 포인트는 코드 포인트 16-01과 40-94 사이의 연속 정렬된 블록에 포함된다.가능한 모든 음절 클러스터가 이 범위에 포함되는 것은 아닙니다.KPS 9566의 다양한 주문과 가용성을 비교합니다.

initial+vowel+final 음절 ,, ,, ,, are는 포함되지만 initial+vowel 대응어 ,, ,, , 및 쬬는 포함되지 않습니다.초기+최종 음절(예: → → → → 한)을 입력하려면 입력 방법이 먼저 초기+음절+음절+음절을 통과해야 하므로 입력 시 문제가 발생하곤 했습니다.

여기에 나열되지 않은 항목은 8바이트 구성 시퀀스를 사용하여 나타낼 수 있습니다.다른 모든 현대 자모 클러스터는 UHC에 의해 다른 곳에 코드가 할당됩니다.가능한 모든 현대 자모 군집은 Johab에 의해 코드가 할당됩니다.

Row 16: 가 각 간 갇 갈 갉 갊 감 갑 값 갓 갔 강 갖 갗 같 갚 갛 개 객 갠 갤 갬 갭 갯 갰 갱 갸 갹 갼 걀 걋 걍 걔 걘 걜 거 걱 건 걷 걸 걺 검 겁 것 겄 겅 겆 겉 겊 겋 게 겐 겔 겜 겝 겟 겠 겡 겨 격 겪 견 겯 결 겸 겹 겻 겼 경 곁 계 곈 곌 곕 곗 고 곡 곤 곧 골 곪 곬 곯 곰 곱 곳 공 곶 과 곽 관 괄 괆
Row 17: 괌 괍 괏 광 괘 괜 괠 괩 괬 괭 괴 괵 괸 괼 굄 굅 굇 굉 교 굔 굘 굡 굣 구 국 군 굳 굴 굵 굶 굻 굼 굽 굿 궁 궂 궈 궉 권 궐 궜 궝 궤 궷 귀 귁 귄 귈 귐 귑 귓 규 균 귤 그 극 근 귿 글 긁 금 급 긋 긍 긔 기 긱 긴 긷 길 긺 김 깁 깃 깅 깆 깊 까 깍 깎 깐 깔 깖 깜 깝 깟 깠 깡 깥 깨 깩 깬 깰 깸
Row 18: 깹 깻 깼 깽 꺄 꺅 꺌 꺼 꺽 꺾 껀 껄 껌 껍 껏 껐 껑 께 껙 껜 껨 껫 껭 껴 껸 껼 꼇 꼈 꼍 꼐 꼬 꼭 꼰 꼲 꼴 꼼 꼽 꼿 꽁 꽂 꽃 꽈 꽉 꽐 꽜 꽝 꽤 꽥 꽹 꾀 꾄 꾈 꾐 꾑 꾕 꾜 꾸 꾹 꾼 꿀 꿇 꿈 꿉 꿋 꿍 꿎 꿔 꿜 꿨 꿩 꿰 꿱 꿴 꿸 뀀 뀁 뀄 뀌 뀐 뀔 뀜 뀝 뀨 끄 끅 끈 끊 끌 끎 끓 끔 끕 끗 끙
Row 19: 끝 끼 끽 낀 낄 낌 낍 낏 낑 나 낙 낚 난 낟 날 낡 낢 남 납 낫 났 낭 낮 낯 낱 낳 내 낵 낸 낼 냄 냅 냇 냈 냉 냐 냑 냔 냘 냠 냥 너 넉 넋 넌 널 넒 넓 넘 넙 넛 넜 넝 넣 네 넥 넨 넬 넴 넵 넷 넸 넹 녀 녁 년 녈 념 녑 녔 녕 녘 녜 녠 노 녹 논 놀 놂 놈 놉 놋 농 높 놓 놔 놘 놜 놨 뇌 뇐 뇔 뇜 뇝
Row 20: 뇟 뇨 뇩 뇬 뇰 뇹 뇻 뇽 누 눅 눈 눋 눌 눔 눕 눗 눙 눠 눴 눼 뉘 뉜 뉠 뉨 뉩 뉴 뉵 뉼 늄 늅 늉 느 늑 는 늘 늙 늚 늠 늡 늣 능 늦 늪 늬 늰 늴 니 닉 닌 닐 닒 님 닙 닛 닝 닢 다 닥 닦 단 닫 달 닭 닮 닯 닳 담 답 닷 닸 당 닺 닻 닿 대 댁 댄 댈 댐 댑 댓 댔 댕 댜 더 덕 덖 던 덛 덜 덞 덟 덤 덥
Row 21: 덧 덩 덫 덮 데 덱 덴 델 뎀 뎁 뎃 뎄 뎅 뎌 뎐 뎔 뎠 뎡 뎨 뎬 도 독 돈 돋 돌 돎 돐 돔 돕 돗 동 돛 돝 돠 돤 돨 돼 됐 되 된 될 됨 됩 됫 됴 두 둑 둔 둘 둠 둡 둣 둥 둬 뒀 뒈 뒝 뒤 뒨 뒬 뒵 뒷 뒹 듀 듄 듈 듐 듕 드 득 든 듣 들 듦 듬 듭 듯 등 듸 디 딕 딘 딛 딜 딤 딥 딧 딨 딩 딪 따 딱 딴 딸
Row 22: 땀 땁 땃 땄 땅 땋 때 땍 땐 땔 땜 땝 땟 땠 땡 떠 떡 떤 떨 떪 떫 떰 떱 떳 떴 떵 떻 떼 떽 뗀 뗄 뗌 뗍 뗏 뗐 뗑 뗘 뗬 또 똑 똔 똘 똥 똬 똴 뙈 뙤 뙨 뚜 뚝 뚠 뚤 뚫 뚬 뚱 뛔 뛰 뛴 뛸 뜀 뜁 뜅 뜨 뜩 뜬 뜯 뜰 뜸 뜹 뜻 띄 띈 띌 띔 띕 띠 띤 띨 띰 띱 띳 띵 라 락 란 랄 람 랍 랏 랐 랑 랒 랖 랗
Row 23: 래 랙 랜 랠 램 랩 랫 랬 랭 랴 략 랸 럇 량 러 럭 런 럴 럼 럽 럿 렀 렁 렇 레 렉 렌 렐 렘 렙 렛 렝 려 력 련 렬 렴 렵 렷 렸 령 례 롄 롑 롓 로 록 론 롤 롬 롭 롯 롱 롸 롼 뢍 뢨 뢰 뢴 뢸 룀 룁 룃 룅 료 룐 룔 룝 룟 룡 루 룩 룬 룰 룸 룹 룻 룽 뤄 뤘 뤠 뤼 뤽 륀 륄 륌 륏 륑 류 륙 륜 률 륨 륩
Row 24: 륫 륭 르 륵 른 를 름 릅 릇 릉 릊 릍 릎 리 릭 린 릴 림 립 릿 링 마 막 만 많 맏 말 맑 맒 맘 맙 맛 망 맞 맡 맣 매 맥 맨 맬 맴 맵 맷 맸 맹 맺 먀 먁 먈 먕 머 먹 먼 멀 멂 멈 멉 멋 멍 멎 멓 메 멕 멘 멜 멤 멥 멧 멨 멩 며 멱 면 멸 몃 몄 명 몇 몌 모 목 몫 몬 몰 몲 몸 몹 못 몽 뫄 뫈 뫘 뫙 뫼
Row 25: 묀 묄 묍 묏 묑 묘 묜 묠 묩 묫 무 묵 묶 문 묻 물 묽 묾 뭄 뭅 뭇 뭉 뭍 뭏 뭐 뭔 뭘 뭡 뭣 뭬 뮈 뮌 뮐 뮤 뮨 뮬 뮴 뮷 므 믄 믈 믐 믓 미 믹 민 믿 밀 밂 밈 밉 밋 밌 밍 및 밑 바 박 밖 밗 반 받 발 밝 밞 밟 밤 밥 밧 방 밭 배 백 밴 밸 뱀 뱁 뱃 뱄 뱅 뱉 뱌 뱍 뱐 뱝 버 벅 번 벋 벌 벎 범 법 벗
Row 26: 벙 벚 베 벡 벤 벧 벨 벰 벱 벳 벴 벵 벼 벽 변 별 볍 볏 볐 병 볕 볘 볜 보 복 볶 본 볼 봄 봅 봇 봉 봐 봔 봤 봬 뵀 뵈 뵉 뵌 뵐 뵘 뵙 뵤 뵨 부 북 분 붇 불 붉 붊 붐 붑 붓 붕 붙 붚 붜 붤 붰 붸 뷔 뷕 뷘 뷜 뷩 뷰 뷴 뷸 븀 븃 븅 브 븍 븐 블 븜 븝 븟 비 빅 빈 빌 빎 빔 빕 빗 빙 빚 빛 빠 빡 빤
Row 27: 빨 빪 빰 빱 빳 빴 빵 빻 빼 빽 뺀 뺄 뺌 뺍 뺏 뺐 뺑 뺘 뺙 뺨 뻐 뻑 뻔 뻗 뻘 뻠 뻣 뻤 뻥 뻬 뼁 뼈 뼉 뼘 뼙 뼛 뼜 뼝 뽀 뽁 뽄 뽈 뽐 뽑 뽕 뾔 뾰 뿅 뿌 뿍 뿐 뿔 뿜 뿟 뿡 쀼 쁑 쁘 쁜 쁠 쁨 쁩 삐 삑 삔 삘 삠 삡 삣 삥 사 삭 삯 산 삳 살 삵 삶 삼 삽 삿 샀 상 샅 새 색 샌 샐 샘 샙 샛 샜 생 샤
Row 28: 샥 샨 샬 샴 샵 샷 샹 섀 섄 섈 섐 섕 서 석 섞 섟 선 섣 설 섦 섧 섬 섭 섯 섰 성 섶 세 섹 센 셀 셈 셉 셋 셌 셍 셔 셕 션 셜 셤 셥 셧 셨 셩 셰 셴 셸 솅 소 속 솎 손 솔 솖 솜 솝 솟 송 솥 솨 솩 솬 솰 솽 쇄 쇈 쇌 쇔 쇗 쇘 쇠 쇤 쇨 쇰 쇱 쇳 쇼 쇽 숀 숄 숌 숍 숏 숑 수 숙 순 숟 술 숨 숩 숫 숭
Row 29: 숯 숱 숲 숴 쉈 쉐 쉑 쉔 쉘 쉠 쉥 쉬 쉭 쉰 쉴 쉼 쉽 쉿 슁 슈 슉 슐 슘 슛 슝 스 슥 슨 슬 슭 슴 습 슷 승 시 식 신 싣 실 싫 심 십 싯 싱 싶 싸 싹 싻 싼 쌀 쌈 쌉 쌌 쌍 쌓 쌔 쌕 쌘 쌜 쌤 쌥 쌨 쌩 썅 써 썩 썬 썰 썲 썸 썹 썼 썽 쎄 쎈 쎌 쏀 쏘 쏙 쏜 쏟 쏠 쏢 쏨 쏩 쏭 쏴 쏵 쏸 쐈 쐐 쐤 쐬 쐰
Row 30: 쐴 쐼 쐽 쑈 쑤 쑥 쑨 쑬 쑴 쑵 쑹 쒀 쒔 쒜 쒸 쒼 쓩 쓰 쓱 쓴 쓸 쓺 쓿 씀 씁 씌 씐 씔 씜 씨 씩 씬 씰 씸 씹 씻 씽 아 악 안 앉 않 알 앍 앎 앓 암 압 앗 았 앙 앝 앞 애 액 앤 앨 앰 앱 앳 앴 앵 야 약 얀 얄 얇 얌 얍 얏 양 얕 얗 얘 얜 얠 얩 어 억 언 얹 얻 얼 얽 얾 엄 업 없 엇 었 엉 엊 엌 엎
Row 31: 에 엑 엔 엘 엠 엡 엣 엥 여 역 엮 연 열 엶 엷 염 엽 엾 엿 였 영 옅 옆 옇 예 옌 옐 옘 옙 옛 옜 오 옥 온 올 옭 옮 옰 옳 옴 옵 옷 옹 옻 와 왁 완 왈 왐 왑 왓 왔 왕 왜 왝 왠 왬 왯 왱 외 왹 왼 욀 욈 욉 욋 욍 요 욕 욘 욜 욤 욥 욧 용 우 욱 운 울 욹 욺 움 웁 웃 웅 워 웍 원 월 웜 웝 웠 웡 웨
Row 32: 웩 웬 웰 웸 웹 웽 위 윅 윈 윌 윔 윕 윗 윙 유 육 윤 율 윰 윱 윳 융 윷 으 윽 은 을 읊 음 읍 읏 응 읒 읓 읔 읕 읖 읗 의 읜 읠 읨 읫 이 익 인 일 읽 읾 잃 임 입 잇 있 잉 잊 잎 자 작 잔 잖 잗 잘 잚 잠 잡 잣 잤 장 잦 재 잭 잰 잴 잼 잽 잿 쟀 쟁 쟈 쟉 쟌 쟎 쟐 쟘 쟝 쟤 쟨 쟬 저 적 전 절 젊
Row 33: 점 접 젓 정 젖 제 젝 젠 젤 젬 젭 젯 젱 져 젼 졀 졈 졉 졌 졍 졔 조 족 존 졸 졺 좀 좁 좃 종 좆 좇 좋 좌 좍 좔 좝 좟 좡 좨 좼 좽 죄 죈 죌 죔 죕 죗 죙 죠 죡 죤 죵 주 죽 준 줄 줅 줆 줌 줍 줏 중 줘 줬 줴 쥐 쥑 쥔 쥘 쥠 쥡 쥣 쥬 쥰 쥴 쥼 즈 즉 즌 즐 즘 즙 즛 증 지 직 진 짇 질 짊 짐 집 짓
Row 34: 징 짖 짙 짚 짜 짝 짠 짢 짤 짧 짬 짭 짯 짰 짱 째 짹 짼 쨀 쨈 쨉 쨋 쨌 쨍 쨔 쨘 쨩 쩌 쩍 쩐 쩔 쩜 쩝 쩟 쩠 쩡 쩨 쩽 쪄 쪘 쪼 쪽 쫀 쫄 쫌 쫍 쫏 쫑 쫓 쫘 쫙 쫠 쫬 쫴 쬈 쬐 쬔 쬘 쬠 쬡 쭁 쭈 쭉 쭌 쭐 쭘 쭙 쭝 쭤 쭸 쭹 쮜 쮸 쯔 쯤 쯧 쯩 찌 찍 찐 찔 찜 찝 찡 찢 찧 차 착 찬 찮 찰 참 찹 찻
Row 35: 찼 창 찾 채 책 챈 챌 챔 챕 챗 챘 챙 챠 챤 챦 챨 챰 챵 처 척 천 철 첨 첩 첫 첬 청 체 첵 첸 첼 쳄 쳅 쳇 쳉 쳐 쳔 쳤 쳬 쳰 촁 초 촉 촌 촐 촘 촙 촛 총 촤 촨 촬 촹 최 쵠 쵤 쵬 쵭 쵯 쵱 쵸 춈 추 축 춘 출 춤 춥 춧 충 춰 췄 췌 췐 취 췬 췰 췸 췹 췻 췽 츄 츈 츌 츔 츙 츠 측 츤 츨 츰 츱 츳 층
Row 36: 치 칙 친 칟 칠 칡 침 칩 칫 칭 카 칵 칸 칼 캄 캅 캇 캉 캐 캑 캔 캘 캠 캡 캣 캤 캥 캬 캭 컁 커 컥 컨 컫 컬 컴 컵 컷 컸 컹 케 켁 켄 켈 켐 켑 켓 켕 켜 켠 켤 켬 켭 켯 켰 켱 켸 코 콕 콘 콜 콤 콥 콧 콩 콰 콱 콴 콸 쾀 쾅 쾌 쾡 쾨 쾰 쿄 쿠 쿡 쿤 쿨 쿰 쿱 쿳 쿵 쿼 퀀 퀄 퀑 퀘 퀭 퀴 퀵 퀸 퀼
Row 37: 큄 큅 큇 큉 큐 큔 큘 큠 크 큭 큰 클 큼 큽 킁 키 킥 킨 킬 킴 킵 킷 킹 타 탁 탄 탈 탉 탐 탑 탓 탔 탕 태 택 탠 탤 탬 탭 탯 탰 탱 탸 턍 터 턱 턴 털 턺 텀 텁 텃 텄 텅 테 텍 텐 텔 템 텝 텟 텡 텨 텬 텼 톄 톈 토 톡 톤 톨 톰 톱 톳 통 톺 톼 퇀 퇘 퇴 퇸 툇 툉 툐 투 툭 툰 툴 툼 툽 툿 퉁 퉈 퉜
Row 38: 퉤 튀 튁 튄 튈 튐 튑 튕 튜 튠 튤 튬 튱 트 특 튼 튿 틀 틂 틈 틉 틋 틔 틘 틜 틤 틥 티 틱 틴 틸 팀 팁 팃 팅 파 팍 팎 판 팔 팖 팜 팝 팟 팠 팡 팥 패 팩 팬 팰 팸 팹 팻 팼 팽 퍄 퍅 퍼 퍽 펀 펄 펌 펍 펏 펐 펑 페 펙 펜 펠 펨 펩 펫 펭 펴 편 펼 폄 폅 폈 평 폐 폘 폡 폣 포 폭 폰 폴 폼 폽 폿 퐁
Row 39: 퐈 퐝 푀 푄 표 푠 푤 푭 푯 푸 푹 푼 푿 풀 풂 품 풉 풋 풍 풔 풩 퓌 퓐 퓔 퓜 퓟 퓨 퓬 퓰 퓸 퓻 퓽 프 픈 플 픔 픕 픗 피 픽 핀 필 핌 핍 핏 핑 하 학 한 할 핥 함 합 핫 항 해 핵 핸 핼 햄 햅 햇 했 행 햐 향 허 헉 헌 헐 헒 험 헙 헛 헝 헤 헥 헨 헬 헴 헵 헷 헹 혀 혁 현 혈 혐 협 혓 혔 형 혜 혠
Row 40: 혤 혭 호 혹 혼 홀 홅 홈 홉 홋 홍 홑 화 확 환 활 홧 황 홰 홱 홴 횃 횅 회 획 횐 횔 횝 횟 횡 효 횬 횰 횹 횻 후 훅 훈 훌 훑 훔 훗 훙 훠 훤 훨 훰 훵 훼 훽 휀 휄 휑 휘 휙 휜 휠 휨 휩 휫 휭 휴 휵 휸 휼 흄 흇 흉 흐 흑 흔 흖 흗 흘 흙 흠 흡 흣 흥 흩 희 흰 흴 흼 흽 힁 히 힉 힌 힐 힘 힙 힛 힝

한자 세트

Johab 부호화

KS X 1001에 규정된 Johab 부호화 도표

KS X 1001은 1992년부터 Johab으로 알려진 대체 인코딩을 정의하고 있습니다.이것은 3개의 5비트 값의 시퀀스로서 한글 음절을 나타내며, 2개의 8비트 바이트로 분할되며, 최상위 비트가 첫 번째입니다.리드 바이트의 최상위 비트는 항상 설정됩니다(싱글 바이트 ASCII 또는 KS X 1003과의 조합을 허용).이 인코딩은 다른 컴포넌트의 필러 값을 사용하여 KS X 1001의 4행째의 최신 jamo에도 사용됩니다.한글의 Johab 인코딩은 아래 ^[25]표에 나와 있습니다.

Johab은 초기 jamo(한자의 경우 0xE0–0xF9, 한글 음절 및 현대 jamo를 제외한 비한자의 경우 0xD9^[26]–0xDE)에 대응하지 않는 리드 바이트를 사용하여 KS X 1001의 나머지 바이트를 0x31–0x7E 및 0x91–^[25]0xFE 범위로 인코딩합니다.이러한 코드는 문자의 KS X 1001 코드 ^[26]포인트에서 알고리즘으로 매핑되며 리드 바이트당 두 개의 KS X 1001 행이 있습니다(Shift JIS 비교 및 대비).

더블바이트 상태일 때 EBCDIC 기반 Johab 배리언트의 레이아웃

ASCII 베이스의 Johab 부호화에는,^[27] Microsoft 에 의해서 코드 페이지 1361 의 번호가 붙여져 있습니다.예를 들어 IBM은 EBCDIC에서 Shift Out 세트로 사용하기 위해 다른 공급업체 정의 Johab 변형도 정의합니다.이 변종에서는 시프트인 및 시프트아웃을 사용하여 싱글바이트 EBCDIC 페이지와 Johab을 전환하고, 비항글 문자에 대해 다른 인코딩(레이아웃이 다른 리드바이트 0x40~6C 사용)을 사용하며, 사용자 정의 영역으로서 리드바이트 0xD4~DD를 사용하지만 한글 시프트에서는 1992년 표준으로 동일한 Johab 레이아웃을 사용합니다.out ^[28]상태IBM은 EBCDIC 기반의 상태 저장 Johab 인코딩 코드 페이지 1364에 ^[28]번호를 매기고, 한글 문자 수가 적지만 동일한 레이아웃에 있는 해당 인코딩의 ^[29]하위 집합을 코드 페이지 933으로 정의합니다.

삼성이나 골드스타(현 LG) 등 일부 공급업체는 5비트 코드와 자모의 매핑이 아래와 다른 다른 "조합" 인코딩을 사용했으며, 결과적으로 1992년 표준인 ^[ac]조합과 호환되지 않는다.아래 표는 1992년 표준 및 IBM 사용법에 해당합니다.

KS C 5601(/X 1001)의 한글용 Johab 코드: 1992^[25]

5비트 시퀀스	처음에	모음으로	마지막으로
00000	사용하지 않음	사용하지 않음^[광고]	사용하지 않음
00001	필러	사용하지 않음^[애]	필러(빈 최종)
00010	ㄱ	필러	ㄱ
00011	ㄲ	ㅏ	ㄲ
00100	ㄴ	ㅐ	ㄳ
00101	ㄷ	ㅑ	ㄴ
00110	ㄸ	ㅒ	ㄵ
00111	ㄹ	ㅓ	ㄶ
01000	ㅁ	사용하지 않음^[광고]	ㄷ
01001	ㅂ	사용하지 않음^[애]	ㄹ
01010	ㅃ	ㅔ	ㄺ
01011	ㅅ	ㅕ	ㄻ
01100	ㅆ	ㅖ	ㄼ
01101	ㅇ	ㅗ	ㄽ
01110	ㅈ	ㅘ	ㄾ
01111	ㅉ	ㅙ	ㄿ
10000	ㅊ	사용하지 않음^[광고]	ㅀ
10001	ㅋ	사용하지 않음^[애]	ㅁ
10010	ㅌ	ㅚ	사용하지 않음
10011	ㅍ	ㅛ	ㅂ
10100	ㅎ	ㅜ	ㅄ
10101	사용하지 않음	ㅝ	ㅅ
10110	비한글 리드 바이트	ㅞ	ㅆ
10111	비한글 리드 바이트	ㅟ	ㅇ
11000	비한글 리드 바이트	사용하지 않음^[광고]	ㅈ
11001	비한글 리드 바이트	사용하지 않음^[애]	ㅊ
11010	비한글 리드 바이트	ㅠ	ㅋ
11011	비한글 리드 바이트	ㅡ	ㅌ
11100	비한글 리드 바이트	ㅢ	ㅍ
11101	비한글 리드 바이트	ㅣ	ㅎ
11110	비한글 리드 바이트	사용하지 않음	사용하지 않음
11111	사용하지 않음	사용하지 않음	사용하지 않음

각주

^ Korean: 정보 교환용 부호계 (한글 및 한자), romanized: Jeongbo Gyohwan'yong Buhogye (Hangeul mich Hanja)
^ ^a ^b ISO 2022 호환94ⁿ 문자 집합으로서 플레인 스페이스와 삭제 문자는 각각 0x20 및 0x7F(0xA0 및 0xFF가 아님)에서 항상 싱글 바이트 코드로 사용할 수 있습니다.
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ 애플에 의해 ASCII 디짓, 정사각형 U+20DE 및 전용 문자 U+F87C의 ^[19]시퀀스에 매핑됩니다.여기에 시뮬레이션된 외관입니다.
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k Apple에 의해 ASCII 시퀀스에 매핑됩니다.각 괄호 안에 숫자가 있고, 그 앞에 프라이빗 유스 문자 U+F863이 ^[19]붙습니다.여기에 시뮬레이션된 외관입니다.
^ 0xA2D2보다 좁습니다.애플은 왕복용으로 전용 캐릭터 U+F87F를 추가했습니다.
^ 오른쪽 선이 굵은 세로 선이 2개 있습니다.Apple은 이것을 통상적인 더블 세로형 U+2016())에 덧붙여 왕복용의 전용 문자 U+F87B에 매핑 하고 있습니다.U+1D102는 의도한 외관을 반영하고 있습니다.
^ 왼쪽 선이 굵은 세로 선이 2개 있습니다.Apple은 이것을 일반적인 더블 세로형 U+2016())과 왕복 전용 문자 U+F87C에 매핑합니다. U+1D103은 의도한 외관을 반영하여 여기에 표시되어 있습니다.
^ 문자 셀의 왼쪽 하단에 정렬된 변형으로, 수평으로 사용됩니다.Apple은 이를 U+FF01+F874에 매핑합니다. U+F874는 라운드 트립을 ^[19]위해 Apple이 이 문자를 태그하기 위해 사용하는 개인 사용 문자입니다.최근에는 ^[21]추가된 변동 선택기 1(U+FE00)^[22]을 사용하여 이 형식에 대해 표준화된 변동 시퀀스가 추가되었습니다.
^ 문자 셀의 왼쪽 하단에 정렬된 변형으로, 수평으로 사용됩니다.Apple은 이를 U+3002+F87D에 매핑합니다. U+F87D는 라운드 트립을 ^[19]위해 Apple이 이 문자를 태그하기 위해 사용하는 개인 사용 문자입니다.최근에는 ^[21]추가된 변동 선택기 1(U+FE00)^[22]을 사용하여 이 형식에 대해 표준화된 변동 시퀀스가 추가되었습니다.
^ ^a ^b 복제, 라운드 ^[19]트립을 위해 개인 사용 문자 U+F87F가 추가된 Apple에 의해 매핑됩니다.
^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3257+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3257은 동그라미가 쳐지지 않은 ^[19]문자입니다.
^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3258+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3258은 동그라미가 쳐지지 않은 ^[19]문자입니다.
^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3259+에 맵F87A. 여기서 U+F87A는 전용 문자이고 U+3259는 채워지지 않은 동그라미 ^[19]문자입니다.
^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+325A+에 맵F87A(U+F87A는 전용 문자, U+325A는 미채움 동그라미 문자)^[19]
^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3251+F87A에 매핑됩니다.U+F87A는 개인 사용 문자이고 U+3251은 채워지지 않은 동그라미 ^[19]문자입니다.
^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3252+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3252는 채워지지 않은 동그라미 ^[19]문자입니다.
^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3253+에 맵F87A. 여기서 U+F87A는 전용 문자이고 U+3253은 채워지지 않은 동그라미 ^[19]문자입니다.
^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3254+에 맵F87A(U+F87A는 전용 문자, U+3254는 미채움 동그라미 문자)^[19]
^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3255+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3255는 동그라미가 쳐지지 않은 ^[19]문자입니다.
^ 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3256+F87A에 매핑됩니다.여기서 U+F87A는 전용 문자이고 U+3256은 동그라미가 쳐지지 않은 ^[19]문자입니다.
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j Apple에 의해 ASCII 시퀀스에 매핑되며, 프리픽스에는 프라이빗 유스 문자 U+F862가 ^[19]붙습니다.
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ 애플에 의해 ASCII 디짓, 정사각형 U+20DE 및 전용 문자 U+F875의 ^[19]시퀀스에 매핑됩니다.여기에 시뮬레이션된 외관입니다.
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k Apple에 의해 ASCII 시퀀스에 매핑됩니다.각 괄호 안에 숫자가 있고, 그 앞에 프라이빗 유스 문자 U+F866이 ^[19]붙습니다.여기에 시뮬레이션된 외관입니다.
^ ^a ^b ^c ^d 이들은 주로 행 1에 중복된 문자입니다.Apple은 "긴" 버전으로 설명하고 라운드 트립을 위해 ^[19]전용 문자 U+F879를 추가합니다.
^ ^a ^b ^c ^d 또한 MacKorean 인코딩에는 KS X 1001 플레인 범위 밖에 있는 다양한 스타일의 화살표 세트(흰색 화살표 포함)가 포함되어 있으며 리드 바이트는 0xA8과 0xAC, 트레일 바이트는 0x41과 0xA0 사이입니다.Apple은 라운드 트립을 ^[19]위해 이 흰색 화살표 세트에 전용 문자 U+F878을 추가합니다.
^ ^a ^b 1행의 표시와 달리 이 두 마크는 낮은 위치(U+301F와 유사)에 표시되도록 되어 있습니다.Apple은 이를 ^[19]구별하기 위해 개인 사용 문자 U+F873을 추가합니다.
^ Apple은 이것을 U+21E7+F87F에 매핑합니다.여기서 U+21E7은 흰색 위쪽^[19] 화살표이고 U+F87F는 개인 사용 문자이지만 이 문자는 검은색 ^[24]화살표입니다.표시된 문자는 Apple의 맵핑 테이블을 후술하는 유니코드 문자로, 이 Mac Korean 문자의 문자와^[24] 유사합니다.
^ Apple은 이를 일련의 ASCII 느낌표와 그 뒤에 개인 사용 문자 U+F87F에 ^[19]매핑합니다.
^ 이러한 인코딩에 대한 매핑은 여기서 사용할 수 있습니다.
^ ^a ^b ^c ^d 이것을 사용하는 경우, C0 제어 코드 범위의 트레일 바이트가 됩니다.
^ ^a ^b ^c ^d 이것을 사용하면 ASCII의 0x2_ 행과 0x3_ 행에 트레일 바이트가 생성됩니다.Johab은 대부분의 일반적인 레거시 CJK 인코딩(Shift JIS, GBK, Big5)과 마찬가지로 트레일 바이트에 0x2_ 행을 사용하지 않습니다.EBCDIC 기반 버전의 Johab은 EBCDIC 제어 코드 범위에 있으므로 어느 행의 추적 바이트도 사용하지 않습니다.

레퍼런스

^ ^a ^b ^c ^d ^e Lunde, Ken (2009). "Chapter 3: Character Set Standards". CJKV Information Processing. p. 143-148. ISBN 978-0596514471.
^ ^a ^b ^c ^d ^e ^f Hwang, Jinsang (2005). The Social Shaping of ICTs Standards: A Case of National Coded Character Set Standards Controversy in Korea (PDF). University of Edinburgh.
^ ^a ^b ^c Lunde, Ken (1995-12-18). "2.4.6: Obsolete Standards". CJK.INF Version 1.9.
^ ^a ^b Shin, Jungshik. "What are KS X 1001(KS C 5601) and other Hangul codes?". Hangul & Internet in Korea FAQ.
^ ^a ^b ^c ^d Lunde, Ken (1995-12-18). "3.3.6: N-byte Hangul". CJK.INF Version 1.9.
^ ^a ^b "INFO: Hangul (Korean) Character Sets", Microsoft Support, Microsoft
^ ^a ^b Zsigri, Gyula (2002-06-18). "KSC and UHC".
^ Chang, Hye-Shik (28 November 2021). "cpython/Modules/cjkcodecs/_codecs_kr.c (revision d3faf43)". cPython source tree. Python Software Foundation.
^ ^a ^b ^c Chung, Jaemin (2017-03-30). Proposal to add an informative note to U+3164 HANGUL FILLER (PDF). Unicode Consortium. UTC L2/17-081.
^ "Code Page 01040" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
^ "Code Page 00891" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
^ "KSRI-87-37-IR: 항을・한자 코드 표준화에 관한 예연구: A Study on Standardization of Hangul and Hanja Codes" (PDF) (in Korean). Ministry of Science and Technology. 1987. p. 68. Archived from the original (PDF) on 2019-03-01.
^ "ibm-1363_P110-1997 (lead byte A1)". ICU Demonstration - Converter Explorer. International Components for Unicode / Unicode Consortium.
^ "euc-kr (lead byte A1)". ICU Demonstration - Converter Explorer. International Components for Unicode.
^ ^a ^b ^c ^d "Map (external version) from Mac OS Korean encoding to Unicode 3.2 and later". Apple.
^ "windows-949-2000 (lead byte A1)". ICU Demonstration - Converter Explorer. International Components for Unicode / Unicode Consortium.
^ ^a ^b ^c ^d "Lead Byte A1-A2 (Code page 949)". MSDN. Microsoft.
^ Korea Bureau of Standards (1988-10-01). Korean Graphic Character Set for Information Interchange (PDF). ITSCJ/IPSJ. ISO-IR-149.
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k ^l ^m ⁿ ^o ^p ^q ^r ^s ^t ^u ^v ^w ^x ^y ^z ^aa ^ab ^ac ^ad ^ae Apple (2005-04-05). "Map (external version) from Mac OS Korean encoding to Unicode 3.2 and later". Unicode Consortium.
^ "windows-949-2000 (lead byte A2)". ICU Demonstration - Converter Explorer. International Components for Unicode / Unicode Consortium.
^ ^a ^b Lunde, Ken (2018-01-21). "Proposal to add standardized variation sequences for fullwidth East Asian punctuation" (PDF). UTC L2/17-436.
^ ^a ^b "StandardizedVariants.txt: Standardized Variation Sequences". Unicode Character Database. Unicode Consortium.
^ Lunde, Ken (2009). "Seemingly Missing Characters". CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. p. 180. ISBN 978-0-596-51447-1.
^ ^a ^b Lunde, Ken (2009). "Appendix E: Vendor Character Set Standards" (PDF). CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. ISBN 978-0-596-51447-1.
^ ^a ^b ^c Lunde, Ken (2008). "Chapter 4: Encoding Methods (§ Johab Encoding—KS X 1001:2004)". CJKV Information Processing (2nd ed.). Sebastopol, California: O'Reilly Media. pp. 268–273. ISBN 978-0-596-51447-1.
^ ^a ^b Shin, Jungshik (2011-10-14) [1999-08-16]. Johab to Unicode table. Unicode Consortium.
^ "Code Page Identifiers". Windows Dev Center. Microsoft.
^ ^a ^b "ibm-1364_P110-2007". International Components for Unicode. Unicode Consortium.
^ "ibm-933_P110-1995". International Components for Unicode. Unicode Consortium.

외부 링크

[1] Korean: 정보 교환용 부호계 (한글 및 한자), romanized: Jeongbo Gyohwan'yong Buhogye (Hangeul mich Hanja)

[iso2022fixed-14] ISO 2022 호환94ⁿ 문자 집합으로서 플레인 스페이스와 삭제 문자는 각각 0x20 및 0x7F(0xA0 및 0xFF가 아님)에서 항상 싱글 바이트 코드로 사용할 수 있습니다.

[applelightboxedsingle-23] ^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ 애플에 의해 ASCII 디짓, 정사각형 U+20DE 및 전용 문자 U+F87C의 ^[19]시퀀스에 매핑됩니다.여기에 시뮬레이션된 외관입니다.

[applelightboxeddouble-24] ^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k Apple에 의해 ASCII 시퀀스에 매핑됩니다.각 괄호 안에 숫자가 있고, 그 앞에 프라이빗 유스 문자 U+F863이 ^[19]붙습니다.여기에 시뮬레이션된 외관입니다.

[25] 0xA2D2보다 좁습니다.애플은 왕복용으로 전용 캐릭터 U+F87F를 추가했습니다.

[26] 오른쪽 선이 굵은 세로 선이 2개 있습니다.Apple은 이것을 통상적인 더블 세로형 U+2016())에 덧붙여 왕복용의 전용 문자 U+F87B에 매핑 하고 있습니다.U+1D102는 의도한 외관을 반영하고 있습니다.

[27] 왼쪽 선이 굵은 세로 선이 2개 있습니다.Apple은 이것을 일반적인 더블 세로형 U+2016())과 왕복 전용 문자 U+F87C에 매핑합니다. U+1D103은 의도한 외관을 반영하여 여기에 표시되어 있습니다.

[30] 문자 셀의 왼쪽 하단에 정렬된 변형으로, 수평으로 사용됩니다.Apple은 이를 U+FF01+F874에 매핑합니다. U+F874는 라운드 트립을 ^[19]위해 Apple이 이 문자를 태그하기 위해 사용하는 개인 사용 문자입니다.최근에는 ^[21]추가된 변동 선택기 1(U+FE00)^[22]을 사용하여 이 형식에 대해 표준화된 변동 시퀀스가 추가되었습니다.

[31] 문자 셀의 왼쪽 하단에 정렬된 변형으로, 수평으로 사용됩니다.Apple은 이를 U+3002+F87D에 매핑합니다. U+F87D는 라운드 트립을 ^[19]위해 Apple이 이 문자를 태그하기 위해 사용하는 개인 사용 문자입니다.최근에는 ^[21]추가된 변동 선택기 1(U+FE00)^[22]을 사용하여 이 형식에 대해 표준화된 변동 시퀀스가 추가되었습니다.

[applef87f-32] 복제, 라운드 ^[19]트립을 위해 개인 사용 문자 U+F87F가 추가된 Apple에 의해 매핑됩니다.

[33] 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3257+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3257은 동그라미가 쳐지지 않은 ^[19]문자입니다.

[34] 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3258+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3258은 동그라미가 쳐지지 않은 ^[19]문자입니다.

[35] 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3259+에 맵F87A. 여기서 U+F87A는 전용 문자이고 U+3259는 채워지지 않은 동그라미 ^[19]문자입니다.

[36] 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+325A+에 맵F87A(U+F87A는 전용 문자, U+325A는 미채움 동그라미 문자)^[19]

[37] 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3251+F87A에 매핑됩니다.U+F87A는 개인 사용 문자이고 U+3251은 채워지지 않은 동그라미 ^[19]문자입니다.

[38] 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3252+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3252는 채워지지 않은 동그라미 ^[19]문자입니다.

[39] 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3253+에 맵F87A. 여기서 U+F87A는 전용 문자이고 U+3253은 채워지지 않은 동그라미 ^[19]문자입니다.

[40] 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3254+에 맵F87A(U+F87A는 전용 문자, U+3254는 미채움 동그라미 문자)^[19]

[41] 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3255+F87A에 매핑됩니다.U+F87A는 전용 문자이고 U+3255는 동그라미가 쳐지지 않은 ^[19]문자입니다.

[42] 정확한 일치가 Unicode에 존재합니다(시뮬레이션).Apple은 U+3256+F87A에 매핑됩니다.여기서 U+F87A는 전용 문자이고 U+3256은 동그라미가 쳐지지 않은 ^[19]문자입니다.

[applebrakdouble-43] ^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j Apple에 의해 ASCII 시퀀스에 매핑되며, 프리픽스에는 프라이빗 유스 문자 U+F862가 ^[19]붙습니다.

[appledarkboxedsingle-45] ^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ 애플에 의해 ASCII 디짓, 정사각형 U+20DE 및 전용 문자 U+F875의 ^[19]시퀀스에 매핑됩니다.여기에 시뮬레이션된 외관입니다.

[appledarkboxeddouble-46] ^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k Apple에 의해 ASCII 시퀀스에 매핑됩니다.각 괄호 안에 숫자가 있고, 그 앞에 프라이빗 유스 문자 U+F866이 ^[19]붙습니다.여기에 시뮬레이션된 외관입니다.

[dupquot-47] 이들은 주로 행 1에 중복된 문자입니다.Apple은 "긴" 버전으로 설명하고 라운드 트립을 위해 ^[19]전용 문자 U+F879를 추가합니다.

[whitearrow-48] 또한 MacKorean 인코딩에는 KS X 1001 플레인 범위 밖에 있는 다양한 스타일의 화살표 세트(흰색 화살표 포함)가 포함되어 있으며 리드 바이트는 0xA8과 0xAC, 트레일 바이트는 0x41과 0xA0 사이입니다.Apple은 라운드 트립을 ^[19]위해 이 흰색 화살표 세트에 전용 문자 U+F878을 추가합니다.

[lowmark-49] 1행의 표시와 달리 이 두 마크는 낮은 위치(U+301F와 유사)에 표시되도록 되어 있습니다.Apple은 이를 ^[19]구별하기 위해 개인 사용 문자 U+F873을 추가합니다.

[51] Apple은 이것을 U+21E7+F87F에 매핑합니다.여기서 U+21E7은 흰색 위쪽^[19] 화살표이고 U+F87F는 개인 사용 문자이지만 이 문자는 검은색 ^[24]화살표입니다.표시된 문자는 Apple의 맵핑 테이블을 후술하는 유니코드 문자로, 이 Mac Korean 문자의 문자와^[24] 유사합니다.

[52] Apple은 이를 일련의 ASCII 느낌표와 그 뒤에 개인 사용 문자 U+F87F에 ^[19]매핑합니다.

[58] 이러한 인코딩에 대한 매핑은 여기서 사용할 수 있습니다.

[johabc0-59] 이것을 사용하는 경우, C0 제어 코드 범위의 트레일 바이트가 됩니다.

[johab23-60] 이것을 사용하면 ASCII의 0x2_ 행과 0x3_ 행에 트레일 바이트가 생성됩니다.Johab은 대부분의 일반적인 레거시 CJK 인코딩(Shift JIS, GBK, Big5)과 마찬가지로 트레일 바이트에 0x2_ 행을 사용하지 않습니다.EBCDIC 기반 버전의 Johab은 EBCDIC 제어 코드 범위에 있으므로 어느 행의 추적 바이트도 사용하지 않습니다.

[lundech3-2] Lunde, Ken (2009). "Chapter 3: Character Set Standards". CJKV Information Processing. p. 143-148. ISBN 978-0596514471.

[Hwang-3] ^ ^a ^b ^c ^d ^e ^f Hwang, Jinsang (2005). The Social Shaping of ICTs Standards: A Case of National Coded Character Set Standards Controversy in Korea (PDF). University of Edinburgh.

[cjkinf246-4] Lunde, Ken (1995-12-18). "2.4.6: Obsolete Standards". CJK.INF Version 1.9.

[shin-5] Shin, Jungshik. "What are KS X 1001(KS C 5601) and other Hangul codes?". Hangul & Internet in Korea FAQ.

[cjkinf336-6] Lunde, Ken (1995-12-18). "3.3.6: N-byte Hangul". CJK.INF Version 1.9.

[msinfo-7] "INFO: Hangul (Korean) Character Sets", Microsoft Support, Microsoft

[fontboard-8] Zsigri, Gyula (2002-06-18). "KSC and UHC".

[9] Chang, Hye-Shik (28 November 2021). "cpython/Modules/cjkcodecs/_codecs_kr.c (revision d3faf43)". cPython source tree. Python Software Foundation.

[L2-17-081-10] Chung, Jaemin (2017-03-30). Proposal to add an informative note to U+3164 HANGUL FILLER (PDF). Unicode Consortium. UTC L2/17-081.

[11] "Code Page 01040" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.

[12] "Code Page 00891" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.

[13] "KSRI-87-37-IR: 항을・한자 코드 표준화에 관한 예연구: A Study on Standardization of Hangul and Hanja Codes" (PDF) (in Korean). Ministry of Science and Technology. 1987. p. 68. Archived from the original (PDF) on 2019-03-01.

[15] "ibm-1363_P110-1997 (lead byte A1)". ICU Demonstration - Converter Explorer. International Components for Unicode / Unicode Consortium.

[16] "euc-kr (lead byte A1)". ICU Demonstration - Converter Explorer. International Components for Unicode.

[applemaps-17] "Map (external version) from Mac OS Korean encoding to Unicode 3.2 and later". Apple.

[18] "windows-949-2000 (lead byte A1)". ICU Demonstration - Converter Explorer. International Components for Unicode / Unicode Consortium.

[msmaps-19] "Lead Byte A1-A2 (Code page 949)". MSDN. Microsoft.

[20] Korea Bureau of Standards (1988-10-01). Korean Graphic Character Set for Information Interchange (PDF). ITSCJ/IPSJ. ISO-IR-149.

[mackoreantxt-21] ^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k ^l ^m ⁿ ^o ^p ^q ^r ^s ^t ^u ^v ^w ^x ^y ^z ^aa ^ab ^ac ^ad ^ae Apple (2005-04-05). "Map (external version) from Mac OS Korean encoding to Unicode 3.2 and later". Unicode Consortium.

[22] "windows-949-2000 (lead byte A2)". ICU Demonstration - Converter Explorer. International Components for Unicode / Unicode Consortium.

[utc-l2-17-436-28] Lunde, Ken (2018-01-21). "Proposal to add standardized variation sequences for fullwidth East Asian punctuation" (PDF). UTC L2/17-436.

[ucd-varsels-29] "StandardizedVariants.txt: Standardized Variation Sequences". Unicode Character Database. Unicode Consortium.

[lunde2009chouon-44] Lunde, Ken (2009). "Seemingly Missing Characters". CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. p. 180. ISBN 978-0-596-51447-1.

[lunde2009appE-50] Lunde, Ken (2009). "Appendix E: Vendor Character Set Standards" (PDF). CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. ISBN 978-0-596-51447-1.

[lundejohab-53] Lunde, Ken (2008). "Chapter 4: Encoding Methods (§ Johab Encoding—KS X 1001:2004)". CJKV Information Processing (2nd ed.). Sebastopol, California: O'Reilly Media. pp. 268–273. ISBN 978-0-596-51447-1.

[utcjohab-54] Shin, Jungshik (2011-10-14) [1999-08-16]. Johab to Unicode table. Unicode Consortium.

[winids-55] "Code Page Identifiers". Windows Dev Center. Microsoft.

[ibm1364-56] "ibm-1364_P110-2007". International Components for Unicode. Unicode Consortium.

[57] "ibm-933_P110-1995". International Components for Unicode. Unicode Consortium.

[a]

[1]

[3]

[2]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[b]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[c]

[d]

[e]

[f]

[g]

[h]

[i]

[j]

[k]

[l]

[m]

[n]

[o]

[p]

[q]

[r]

[s]

[t]

[u]

[23]

[v]

[w]

[x]

[y]

[z]

[아아아아아아아아아아아아아아아아아아]

[ab]

[25]

[26]

[27]

[28]

[29]

[ac]

[광고]

[애]

[21]

[22]

[24]

v t 문자 부호화
초기 통신	전신코드 바늘 모스 라틴어 이외의 와분/가나 중국인 키릴 문자 한국인입니다 보도와 머레이 Fieldata ASCII ISO/IEC 646 BCDIC 텔레텍스 및 비디오텍스/텔레텍스트 T.51/ISO/IEC 6937 ITU T.61 ITU T.101 월드 시스템 텔레텍스트 배경 놓다 트랜스코드
ISO/IEC 8859	승인된 부품 - 1 (서유럽) - 2 (중앙유럽) - 3 (말티즈/에스페란토) - 4 (북유럽) -5(키릴 문자) -6 (아랍어) -7(그리스어) -8 (헤브루) -9(터키어) -10 (노르딕) -11(태국) - 13 (발트어) -14 (셀틱) - 15 (신서유럽) -16(로마) 폐기 부품 - 12 (데바나가리) 제안되었지만 승인되지 않음 KOI-8 키릴 문자 사미 적응 웨일스어 바렌츠 키릴 문자 에스토니아어 우크라이나어 키릴 문자
서지학적 용도	MARC-8 앤젤 CCCI/EACC ISO 5426 5426-2 5427 5428 6438 6862
국가 표준	암SCII 브라스키 CNS 11643 DIN 66003 ELOT 927 GOST 10859 GB 2312 GB 12345 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212 JIS X 0213 KOI-7 KPS 9566 KS X 1001 KS X 1002 LST 1564 LST 1590-4 패스 시프트 JIS SI 960 TIS-620 TSCII 가시 SCSII YUSCII
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367 확장 UNIX 코드 / EUC
Mac OS 코드 페이지 ("구체")	아르메니아어 아랍어 바렌츠 키릴 문자 켈트족 중앙유럽어 크로아티아어 키릴 문자 데바나가리 Farsi(페르시아어) 글꼴 X(커밋) 게일어 그루지야어 그리스어 구자라티 구르무키 히브리어 아이슬란드 이누이트 키보드 라틴어(Kermit) 몰타/에스페란토 오감 로마인 루마니아어 사미 터키어 투르크어 키릴 문자 우크라이나어 VT100
DOS 코드 페이지	437 668 708 720 737 770 773 775 776 777 778 850 851 852 853 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 897 899 903 904 932 936 942 949 950 951 1040 1042 1043 1046 1098 1115 1116 1117 1118 1127 3846 아비콤프 CS 인디케이터 CSX 표시기 CSX+ 표시기 CWI-2 이란 시스템 카메니쿠 마조비아 마이크
IBM AIX 코드 페이지	895 896 912 915 921 922 1006 1008 1009 1010 1012 1013 1014 1015 1016 1017 1018 1019 1124 1133
Windows 코드 페이지	CER-GS 932 936 (GBK) 950 1169 확장 Latin-8 1250 1251 1252 1253 1254 1255 1256 1257 1258 1270 키릴어 + 핀란드어 키릴어 + 프랑스어 키릴어 + 독일어 폴리톤 그리스어
EBCDIC 코드 페이지	37 EBCD의 일본어IC DKOI
DEC 단자(VTX)	다국어(MCS) National Replacement(NRCS) 프랑스계 캐나다인 스위스인 스페인어 영국 네덜란드어 핀란드어 프랑스어 노르웨이어 및 덴마크어 스웨덴어 노르웨이어 및 덴마크어(대체) 8비트 그리스어 8 비트 터키어 SI 960 히브리어 특수 그래픽스 테크니컬(TCS)
플랫폼 고유의	1057 도토리 Adobe Standard(Adobe Standard) 어도비 라틴어 1 암스트라드 CPC 애플 II ATASCII 아타리 ST BIOS Casio 계산기 CDC 콤푸콜라 II CP/M+ DEC 기수 50 DEC MCS/NRCS DG 인터내셔널 Fieldata 보석. GSM 03.38 HP 로마자 HP 포커셜 HP RPL 스퀴즈 LICS LMBCS MSX NEC APC 다음 분. 펫스키 세가 SC-3000 날카로운 계산기 샤프 MZ 싱클레어 QL 기호. 텔레텍스트 TI 계산기 TRS-80 Ventura International WISCII XCCS ZX80 ZX81 ZX 스펙트럼
Unicode/ISO/IEC 10646	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC GB 18030 BOCU-1 CESU-8 SCSU TACE16 Unicode 인코딩 비교
TeX 조판 시스템	코르크 마개 LY1 OML OMS OT1
기타 코드 페이지	아비콤프 ASMO 449 빅5 APL 기호의 디지털 부호화 ISO-IR-68 ARIB STD-B24 HZ IEC-P27-1 INIS 7비트 8비트 ISO-IR-169 ISO 2033 KOI KOI8-R KOI8-RU KOI8-U 모지쿄 바다 스탠포드/그것의. 트론 통일 한글 코드
제어 문자	모스 프로시그 C0 및 C1 제어 코드 ISO/IEC 6429 JIS X 0211 유니코드 제어, 형식 및 구분 문자 공백 문자
관련 토픽	CCSID HTML 문자 인코딩 Charset 검출 한통일 하드웨어 코드 페이지 MICR 코드 모지바케 가변 폭 부호화
문자 집합

Search