ISO/IEC 8859-9
ISO/IEC 8859-9MIME / IANA | ISO-8859-9 |
---|---|
에일리어스 | iso-ir-148, latin5, l5, CSISOLatin5[1] |
표준. | TS 5881, ECMA-128, ISO/IEC 8859 |
분류 | ISO 8859(확장 ASCII, ISO 4873 레벨 1) |
확장 | US-ASCII |
에 기반을 둔 | ISO/IEC 8859-1 |
선행 | ISO/IEC 8859-3 |
기타 관련 부호화 | Windows-1254 |
ISO/IEC 8859-9:1999, 정보 테크놀로지 - 8비트 싱글 바이트 코드 그래픽 문자 세트 - Part 9: 라틴 문자 No. 5는 ASCII 기반의 표준 문자 인코딩의 일부이며, 1989년에 초판되었습니다.Ecma International에 의해 ECMA-128로 지정되었으며 TS 5881이 터키 [2]표준으로 지정되었습니다.그것은 비공식적으로 라틴-5 또는 터키어로 불린다.ISO/IEC 8859-3 인코딩보다 더 유용하도록 설계된 터키어입니다.6개의 아이슬란드어 문자(Dd, ,, ))가 터키어 알파벳 고유의 문자(,, I,, ,, ş, ş)로 대체된 것을 제외하고 ISO/IEC 8859-1과 동일합니다.
ISO-8859-9는 ISO/IEC 6429의 C0 및 C1 제어 코드로 보완되는 경우 이 표준의 IANA 우선 문자 집합 이름입니다.현대 응용 프로그램에서는 유니코드 및 UTF-8이 선호됩니다. 새로운 웹 페이지 작성자와 새로운 프로토콜 설계자는 [3]대신 UTF-8을 사용하도록 지시됩니다.2019년 8월 이후 전체 웹페이지 중 0.1%가 ISO-8859-9를 [4][5]사용하고 있으며, 터키에 위치한 웹페이지 중 1.9%가 ISO-8859-9 [6]사용을 선언하고 있다.그러나 WHATWG 인코딩 표준, HTML5에서 허용되는 문자 인코딩과 준수하는 브라우저를 지정하는 support,[7]야 하는 ISO-8859-9 Windows-1254,[3]로 ISO-8859-9에서 C1 제어 코드에 대한 추가 graphi에 ISO-8859-9어 CR범위를 사용할 경우에 따라 차이 처리될은 웹 페이지 표시된 필요로 한다.칼 c(ISO-8859-1과 Windows-1252의 관계와 유사합니다)
Microsoft는 코드 페이지 28599 a.k.a.를 할당했습니다.Windows 의 경우, Windows-28599 에서 ISO-8859-9 로.IBM은 ISO-8859-9에 [8][9]코드 페이지 920(CCSID 920)을 할당했습니다.Ecma International이 ECMA-128로 [10]발행하고 있습니다.
코드 페이지 레이아웃
ISO-8859-1과의 차이점은 문자 아래에 유니코드 코드 포인트 번호가 있습니다.
ISO/IEC 8859-9[11][12][13] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2배 | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3배 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < > | = | > | ? |
4배 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5배 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6배 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7배 | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | ||
8배 | ||||||||||||||||
9배 | ||||||||||||||||
도끼를 | NBSP | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | 부끄럽다 | ® | ¯ |
Bx | ° | ± | ² | ³ | ´ | µ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ | |
철형 | à | 아아 | 」 | ã | ä | å | ᄋ | 츠 | è | 에 | ê | ë | ì | Ⅱ | Î | Ï |
Dx | Ğ 011E | ñ | Ò | ó | o | Õ | 외 | × | ø | Ù | u | Û | ü | I i 0130 | şSH 015E | ß |
예 | 아 | 아 | ★ | ã | ä | å | æ | 츠 | è | 에 | ê | ë | ì | ii | î | ï |
Fx | ğ 011F | ñ | ò | o | o | õ | ö | ÷ | ø | ù | u | û | ü | ı 0131 | ş 015F | ÿ |
「 」를 참조해 주세요.
레퍼런스
- ^ Character Sets, Internet Assigned Numbers Authority (IANA), 2018-12-12
- ^ "Latin-5: A list of the Latin-5 client and server CCSIDs, which includes Turkey". IBM. Archived from the original on 2022-02-13.
- ^ a b van Kesteren, Anne. "Names and labels". Encoding Standard. WHATWG.
- ^ "Historical trends in the usage of character encodings for websites". w3techs.com.
- ^ "Frequently Asked Questions". w3techs.com.
- ^ "Distribution of character encodings among websites that use Turkey". w3techs.com.
- ^ "8.2.2.3. Character encodings". HTML 5.1 2nd Edition. W3C.
User agents must support the encodings defined in the WHATWG Encoding standard, including, but not limited to […]
- ^ "Code page 920 information document". Archived from the original on 2017-01-16.
- ^ "CCSID 920 information document". Archived from the original on 2016-03-27.
- ^ Standard ECMA-128: 8-Bit Single-Byte Coded Graphic Character Sets - Latin Alphabet No. 5 (2nd ed.). 1999.
This Ecma publication is also approved as ISO 8859-9.
- ^ Code Page CPGID 00920 (pdf) (PDF), IBM
- ^ Code Page CPGID 00920 (txt), IBM
- ^ International Components for Unicode (ICU), ibm-920_P100-1995.ucm, 2002-12-03
외부 링크
- ISO/IEC 8859-9:1999
- 표준 ECMA-128: 8비트 싱글 바이트 코드 그래픽스 문자 세트 - 라틴 알파벳 No.5 제2판 (1999년 12월)
- ISO-IR 148 라틴 알파벳 No.5 오른쪽 부분(1988년 10월 1일)