ITU T.61
T.61 je doporučení ITU-T pro kódování znaků pro Teletex. Kódování T.61 je předchůdcem Unicode, a bylo primární znakovou sadou v ASN.1 používaném v prvních verzích protokolů X.500 a X.509 pro kódování řetězců obsahujících znaky používané v západoevropských jazycích.[1] Také se používá ve starší verzi LDAP.[2] T.61 je sice stále podporováno i v moderní verzi X.500 a X.509, přednostně by se však měl používat Unicode. T.61 bývá také nazýváno Code page 1036, CP1036 nebo IBM 01036.
Zatímco ASN.1 se stále široce používá a znaková sada T.61 se používá v některých standardech používajících ASN.1 (například v PKCS #9 společnosti RSA Security), verze 1988-11 standardu T.61 byla nahrazena novější nikdy nepublikovanou verzí 1993-03, kterou ITU-T stáhla.[3] 1988-11 verze je stále dostupný.[3]
T.61 bylo jedním z podporovaných kódování v softwaru Mozilla pro e-mail a HTML do roku 2014, kdy podporovaná kódování byla omezena na kódování uvedené v WHATWG Encoding Standard. T.61 však stále zůstává podporované pro LDAP).[4]
Struktura kódové stránky
[editovat | editovat zdroj]Následující tabulka ukazuje kódování T.61.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | BS | LF | FF | CR | LS1 | LS0 | ||||||||||
1x | SS2 | SUB | ESC | SS3 | ||||||||||||
2x | SP | ! | " | % | & | ' | ( | ) | * | + | , | - | . | / | ||
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | ] | _ | ||
6x | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | |
7x | p | q | r | s | t | u | v | w | x | y | z | C; | DEL | |||
8x | PLD | PLU | ||||||||||||||
9x | CSI | |||||||||||||||
Ax | NBSP | ¡ | ¢ | £ | $ | ¥ | # | § | ¤ | « | ||||||
Bx | ° | ± | ² | ³ | × | µ | ¶ | · | ÷ | » | ¼ | ½ | ¾ | ¿ | ||
Cx | ◌̀ | ◌́ | ◌̂ | ◌̃ | ◌̄ | ◌̆ | ◌̇ | ◌̈ | ◌̈ | ◌̊ | ◌̧ | ◌̲ | ◌̋ | ◌̨ | ◌̌ | |
Dx | ||||||||||||||||
Ex | Ω | Æ | Ð | ª | Ħ | IJ | Ŀ | Ł | Ø | Œ | º | Þ | Ŧ | Ŋ | ʼn | |
Fx | ĸ | æ | đ | ð | ħ | ı | ij | ŀ | ł | ø | œ | ß | þ | ŧ | ŋ |
Poznámky
[editovat | editovat zdroj]- Popis, jak fungují akcenty v 0x..CF fungují je uveden v ITU T.51. Jsou umístěny před písmenem, zatímco Unicode je umisťuje za písmenem.
- V revizi specifikace z roku 1988 je uvedeno, že v revizi specifikace z roku 1980 bylo přiděleno umlautu, ale od té doby bylo zrušeno.[5] původně se používalo k rozlišení mezi umlautem a diaerézou.[9]
- Řídicí sada ISO/IEC 2022 C0 definovaná v T.61 (ISO-IR-106) používá pro SS2 a SS3 kódy 0x19 a 0x1D.[6] Je povoleno používat sekvence ISO/IEC 2022 pro přepínání řídicích sad (na rozdíl od grafických sad) v rámci ISO/IEC 10646 (UCS/Unicode) v kontextech, kde je vhodné zpracovávat ANSI escape kódy, za předpokladu, že každý bajt v sekvenci je doplněn na velikost kódové jednotky kódování,[10] v takovém případě by SS2 a SS3 byly dostupné na U+0019 a U+001D. Běžnější řídicí sada C1 ISO/IEC 6429, jejíž názvy jsou pro informaci uvedeny v kódové tabulce Unicode,[11] však kóduje SS2 a SS3 pomocí U+008E, respektive U+008F.
Odkazy
[editovat | editovat zdroj]Reference
[editovat | editovat zdroj]V tomto článku byl použit překlad textu z článku ITU T.61 na anglické Wikipedii.
- ↑ T.61 : Character repertoire and coded character sets for the international teletex service [online]. [cit. 2019-11-14]. Dostupné online.
- ↑ ldap_8859_to_t61 [online]. PHP Skupina. Dostupné online.
- ↑ a b Recommendation T.61 [online]. ITU-T. Dostupné online.
- ↑ SIVONEN, Henri. Character encoding changes in m-c require c-c action [online]. 2014-09-26. Dostupné online.
- ↑ a b CCITT. Character repertoire and coded character sets for the international teletex service. 1988. vyd. [s.l.]: [s.n.], 1988-11-25. Dostupné online. Recommendation T.61.
- ↑ a b ISO-IR-106. Teletex Primary Set of Control Functions. ITU, 1985-08-01. detail.
- ↑ ISO-IR-107. Teletex Supplementary Set of Control Functions. ITU, 1985-08-01. detail.
- ↑ RFC 1345
- ↑ ITU-T. International interworking for Videotex services. [s.l.]: [s.n.], 1994-11-11. Dostupné online. T.101:1994. S. 248. (Rozdíl mezi kódy je vysvětlen v první poznámce pod tabulkou. Upozornění: Je ve druhém z rozdělených PDF souborů ke stažení. Samotná tabulka je v PDF zobrazena se silným mojibakem (proto se zdá, že zobrazená tabulka neodpovídá poznámkám) a má vypadat zhruba takto.
- ↑ ISO/IEC JTC 1/SC 2, 2017. Information technology — Universal Coded Character Set (UCS). 5. vyd. [s.l.]: ISO. Dostupné online. ISO/IEC 10646. S. 19–20.
- ↑ Unicode Consortium, 2019. C1 Controls and Latin-1 Supplement. [s.l.]: [s.n.]. Dostupné online.
Související články
[editovat | editovat zdroj]- ISO/IEC 6937 (ITU T.51)
Externí odkazy
[editovat | editovat zdroj]- ITU-T Recommendation T.61 v ITU-T
- ISO-IR-103 (ISO-IR registrace pravé části)