ISO 8859
ISO 8859, également appelée plus formellement ISO/CEI 8859, est une norme commune de l'ISO et de la CEI de codage de caractères sur 8 bits pour le traitement informatique du texte. Le standard est divisé en parties numérotées publiées séparément, telles que ISO/CEI 8859-1, ISO/CEI 8859-2, etc., chacune pouvant être référencée de façon informelle en tant que norme en tant que telle. La norme comprend actuellement 15 parties.
| Sommaire |
Introduction
Alors que les 96 caractères imprimables ASCII sont suffisants pour échanger des informations en anglais courant, la plupart des autres langues utilisant l'alphabet latin ont besoin de symboles additionnels non couverts par l'ASCII, tels que ß (allemand), å (suédois et d'autres langues nordiques). ISO 8859 a cherché à remédier à ce problème en utilisant le huitième bit, alors inutilisé en ASCII, pour donner de la place à 128 caractères supplémentaires. Cependant, plus de caractères étaient nécessaires pour parvenir à cette fin par rapport à ce qu'aurait permis un unique codage de caractères sur 8 bits, aussi plusieurs tables de correspondances ont été développées, en incluant au moins 10 tables pour couvrir uniquement le script latin avec les langues modernes officielles.
La norme ISO 8859-n n'est pas totalement identique aux codages de caractères bien connus ISO-8859-n approuvés par l'IANA pour l'utilisation sur l'Internet. Au-delà du trait d'union ajouté présent dans le nom approuvé par l'IANA, les codages diffèrent de sorte que chaque partie du standard ISO assigne, au maximum, 191 caractères dans les étendues d'octets 32 à 126 et 160 à 255, alors que le codage de caractère correspondant approuvé par l'IANA fusionne ces tables de correspondances avec le jeu de contrôle C0 (caractères de contrôles positionnés aux octets de 0 à 31) et le jeu de contrôle C1 (caractères de contrôles positionnés aux octets de 127 à 159), ce qui conduit à une table de caractères 8 bits complète, avec la plupart, sinon la totalité, des valeurs d'octets assignées.
Caractères
La norme ISO 8859 est conçue pour l'échange fiable d'informations, et non pour la typographie; elle omet des symboles nécessaires pour la typographie de haute qualité, telles que les ligatures optionnelles, les marques de citation incurvées, les tirets, etc. de ce fait, les systèmes de composition avancés utilisent souvent des extensions propriétaires ou pointilleuses au-delà des standards ASCII et ISO 8859, ou utilisent plutôt Unicode.
En général, si un caractère ou le symbole n'était pas déjà la partie d'une série de caractère d’informatique largement utilisée et d'habitude n'a pas été non plus fournie sur les claviers de machine à écrire pour une langue nationale, il n'est pas entré. Donc les guillemets double directionnel « et » utilisé pour quelques langues européennes ont été inclus, mais pas les guillemets double directionnel “ et ” utilisé pour l'anglais et quelques autres langues.
Le français n'a pas obtenu ses ligatures œ » et Œ parce que les francophones n'avaient pas eu assez besoin d'eux pour les exiger sur leurs claviers ; ni le Ÿ, parce que ce caractère est seulement utilisé en français en texte majuscule. Ces caractères étaient, cependant, inclus plus tard avec ISO 8859-15, qui a introduit aussi le nouveau caractère d'Euro €. De la même manière la langue hollandaise n'a pas obtenu les lettres ij et IJ parce que les hollandais s'étaient habitués à la dactylographie de ces lettres plutôt comme deux charactères.
Le Roumain n'a pas obtenu au début ses lettres 'Ș/ș' et 'Ț/ț', parce que ces lettres ont été unifiées au début avec 'Ş/ş' et 'Ţ/ţ' par le Consortium Unicode, considérant les formes avec la virgule en dessous d'être les variantes de glyph des formes avec la cédille.
Cependant, les lettres avec la virgule explicite au dessous étaient ultérieurement supplémenté à la norme de Unicode et sont aussi dans ISO 8859-16.
La plupart des codes ISO 8859 fournissent des marques diacritiques exigées pour les diverses langues européennes. Les autres fournissent des alphabets non-romains : alphabet grec, alphabet Cyrillique, alphabet hébraïque, l’arabe et Thaï. Cependant, la norme ne fait pas de provision pour les manuscrits de langues de l'est asiatique (CJK), comme leur système d’écriture idéographique exige beaucoup de milliers de points de code.
Bien qu'il utilise le latin a basé des caractères, Vietnamien n’est pas capable d’être représenté en 96 positions. Les manuscrits en japonais syllabique Kana d'autre part pourrait, mais comme plusieurs autres alphabets du monde ne sont pas codés.
Les parties du standard ISO 8859
ISO 8859 est constitué à ce jour des parties suivantes:
- ISO 8859-1 (latin-1 or européen occidental) — probablement la partie la plus largement utilisée de ISO 8859, couvrant la plupart des langues européennes occidentales : allemand, anglais, basque, catalan, danois, écossais, espagnol, féringien, finnois (partiellement²), français (partiellement²), islandais, irlandais, italien, néerlandais (partiellement¹), norvégien, portugais, rhéto-roman et suédois, certaines langues européennes sud-orientales (albanais), de même que des langues africaines (afrikaans et swahili). Le symbole manquant de l'euro et la capitale Ÿ sont dans la version révisée ISO 8859-15 (latin-9). Le jeu de caractères correspondant ISO-8859-1 approuvé par l'IANA est le codage par défaut des anciens documents HTML ou des documents transmis par messages MIME, tels que les réponses HTTP quand le type de média du document est « text » (par exemple les documents « text/html »).
- ISO 8859-2 (latin-2 or européen central) — supporte les langues d'Europe centrale ou de l'Est basées sur un alphabet romain, y compris le polonais, le tchèque, le slovaque, le slovène et le hongrois. Le symbole de l'euro manquant est présent dans la version ISO 8859-16.
- ISO 8859-3 (latin-3 or européen du Sud) — turc, maltais, et espéranto ; largement supplanté par ISO 8859-9 pour le turc, et Unicode pour l'espéranto.
- ISO 8859-4 (latin-4 or européen du Nord) — estonien, letton, lituanien, groenlandais, and sami.
- ISO 8859-5 (cyrillique) — Couvre la plupart des langues slaves utilisant un alphabet cyrillique, y compris le biélorusse, le bulgare, le macédonien, le russe, le serbe et l'ukrainien.
- ISO 8859-6 (arabe) — Couvre les glyphes arabes les plus communs, bien que pas les tous.
- ISO 8859-7 (grec) — Couvre la langue grecque moderne (orthographe monotonique). Peut être utilisé aussi pour l’ancien grec écrit sans les accents ou dans l'orthographe monotonique, mais manque les signes diacritiques pour l'orthographe polytonique. Ceux-ci ont été introduits avec Unicode.
- ISO 8859-8 (hébreu) — Couvre l'alphabet hébraïque moderne comme utilisé en Israël. En pratique, deux codes différents existent: logique et visuel.
- ISO 8859-9 (latin-5 or turc) — Principalement pareil au ISO 8859-1, mais remplaçant les lettres icelandaises avec les lettres turques. Il est aussi utilisé pour le kurde.
- ISO 8859-10 (latin-6 or nordique) — Un réarrangement de latin-4 considéré plus utile pour les langues nordiques. Les langues baltes utilisent plus souvent le latin-4.
- ISO 8859-11 (langue thaïe, thaï) — Contient la plupart de glyphs pour la langue Thaïlandais. .
- ISO 8859-12 — a été supposé être un latin-7 de couverture Celte, mais ce brouillon a été rejeté. La numérotation a continué avec -13.
- ISO 8859-13 (latin-7 or balte) — Quelques glyphes supplémentaires pour les langues baltes qui se manquaient en latin-4 et latin-6.
- ISO 8859-14 (latin-8 or celtique) — Un remplacement de la proposition l'ISO 8859-12, offrant la couverture des langues celtes telles que gaélique et la langue bretonne.
- ISO 8859-15 (latin-9 ou parfois de façon impropre latin-0) — une révision de 8859-1 qu'enlève quelques symboles peu-utilisés, les remplaçant avec le symbole d'Euro € et les lettres Š, š, Ž, ž, Œ, œ, et Ÿ, qui complète la couverture du français et finlandais.
- ISO 8859-16 (latin-10 or européen du Sud-Est) — pour l’albanais, croate, hongrois, italien, polonais, roumain et slovène, mais aussi finlandais, français, allemand et gaélique irlandais (en nouvelle orthographe). Cette police mise plus sur les lettres que les symboles. Le signe de monnaie est remplacé avec le symbole d'Euro.
¹: seulement le IJ/ij (Dutch Y) se manque, et peut être representé comme IJ
²: çes charactères sont au ISO 8859-15
Chaque partie d'ISO 8859 est conçu pour représenter des langues qui emprunte souvent une de chaque autre, donc les caractères nécessaires par chaque langue sont d'habitude accommodée par une partie seule. Cependant, il y a quelques combinaisons de caractères et langue qui ne sont pas accommodées sans les transcriptions. Les efforts ont été faits pour rendre les conversions le plus facile possible. Par exemple, Allemand a tous ses sept caractères spéciaux aux positions pareilles dans toutes variantes latines (1-4, 9-10, 13-16), et en beaucoup de positions que les caractères diffèrent seulement les signes diacritiques varient entre les séries. En particulier, les variantes 1-4 ont été conçus conjointement et ont la propriété que chaque caractère codé apparaît à une position donnée ou pas du tout.
Table
| binaire | Oct | Déc | Hex | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 13 | 14 | 15 | 16 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10100000 | 240 | 160 | A0 | NBSP | |||||||||||||||
| 10100001 | 241 | 161 | A1 | ¡ | Ą | Ħ | Ą | Ё | ʽ | ¡ | Ą | ก | " | Ḃ | ¡ | Ą | |||
| 10100010 | 242 | 162 | A2 | ¢ | ˘ | ˘ | ĸ | Ђ | ʼ | ¢ | ¢ | Ē | ข | ¢ | ḃ | ¢ | ą | ||
| 10100011 | 243 | 163 | A3 | £ | Ł | £ | Ŗ | Ѓ | £ | £ | £ | Ģ | ฃ | £ | £ | £ | Ł | ||
| 10100100 | 244 | 164 | A4 | ¤ | ¤ | ¤ | ¤ | Є | ¤ | € | ¤ | ¤ | Ī | ค | ¤ | Ċ | € | € | |
| 10100101 | 245 | 165 | A5 | ¥ | Ľ | Ĩ | Ѕ | ₯ | ¥ | ¥ | Ĩ | ฅ | " | ċ | ¥ | " | |||
| 10100110 | 246 | 166 | A6 | ¦ | Ś | Ĥ | Ļ | І | ¦ | ¦ | ¦ | Ķ | ฆ | ¦ | Ḋ | Š | Š | ||
| 10100111 | 247 | 167 | A7 | § | § | § | § | Ї | § | § | § | § | ง | § | § | § | § | ||
| 10101000 | 250 | 168 | A8 | ¨ | ¨ | ¨ | ¨ | Ј | ¨ | ¨ | ¨ | Ļ | จ | Ø | Ẁ | š | š | ||
| 10101001 | 251 | 169 | A9 | © | Š | İ | Š | Љ | © | © | © | Đ | ฉ | © | © | © | © | ||
| 10101010 | 252 | 170 | AA | ª | Ş | Ş | Ē | Њ | × | ª | Š | ช | Ŗ | Ẃ | ª | Ș | |||
| 10101011 | 253 | 171 | AB | « | Ť | Ğ | Ģ | Ћ | « | « | « | Ŧ | ซ | « | ḋ | « | « | ||
| 10101100 | 254 | 172 | AC | ¬ | Ź | Ĵ | Ŧ | Ќ | ، | ¬ | ¬ | ¬ | Ž | ฌ | ¬ | Ỳ | ¬ | Ź | |
| 10101101 | 255 | 173 | AD | | | | | | | | | | | ญ | | | | | |
| 10101110 | 256 | 174 | AE | ® | Ž | Ž | Ў | ® | ® | Ū | ฎ | ® | ® | ® | ź | ||||
| 10101111 | 257 | 175 | AF | ¯ | Ż | Ż | ¯ | Џ | ― | ‾ | ¯ | Ŋ | ฏ | Æ | Ÿ | ¯ | Ż | ||
| 10110000 | 260 | 176 | B0 | ° | ° | ° | ° | А | ° | ° | ° | ° | ฐ | ° | Ḟ | ° | ° | ||
| 10110001 | 261 | 177 | B1 | ± | ą | ħ | ą | Б | ± | ± | ± | ą | ฑ | ± | ḟ | ± | ± | ||
| 10110010 | 262 | 178 | B2 | ² | ˛ | ² | ˛ | В | ² | ² | ² | ē | ฒ | ² | Ġ | ² | Č | ||
| 10110011 | 263 | 179 | B3 | ³ | ł | ³ | ŗ | Г | ³ | ³ | ³ | ģ | ณ | ³ | ġ | ³ | ł | ||
| 10110100 | 264 | 180 | B4 | ´ | ´ | ´ | ´ | Д | ΄ | ´ | ´ | ī | ด | " | Ṁ | Ž | Ž | ||
| 10110101 | 265 | 181 | B5 | µ | ľ | µ | ĩ | Е | ΅ | µ | µ | ĩ | ต | µ | ṁ | µ | " | ||
| 10110110 | 266 | 182 | B6 | ¶ | ś | ĥ | ļ | Ж | Ά | ¶ | ¶ | ķ | ถ | ¶ | ¶ | ¶ | ¶ | ||
| 10110111 | 267 | 183 | B7 | · | ˇ | · | ˇ | З | · | · | · | · | ท | · | Ṗ | · | · | ||
| 10111000 | 270 | 184 | B8 | ¸ | ¸ | ¸ | ¸ | И | Έ | ¸ | ¸ | ļ | ธ | ø | ẁ | ž | ž | ||
| 10111001 | 271 | 185 | B9 | ¹ | š | ı | š | Й | Ή | ¹ | ¹ | đ | น | ¹ | ṗ | ¹ | č | ||
| 10111010 | 272 | 186 | BA | º | ş | ş | ē | К | Ί | ÷ | º | š | บ | ŗ | ẃ | º | ș | ||
| 10111011 | 273 | 187 | BB | » | ť | ğ | ģ | Л | ؛ | » | » | » | ŧ | ป | » | Ṡ | » | » | |
| 10111100 | 274 | 188 | BC | ¼ | ź | ĵ | ŧ | М | Ό | ¼ | ¼ | ž | ผ | ¼ | ỳ | Œ | Œ | ||
| 10111101 | 275 | 189 | BD | ½ | ˝ | ½ | Ŋ | Н | ½ | ½ | ½ | ― | ฝ | ½ | Ẅ | œ | œ | ||
| 10111110 | 276 | 190 | BE | ¾ | ž | ž | О | Ύ | ¾ | ¾ | ū | พ | ¾ | ẅ | Ÿ | Ÿ | |||
| 10111111 | 277 | 191 | BF | ¿ | ż | ż | ŋ | П | ؟ | Ώ | ¿ | ŋ | ฟ | æ | ṡ | ¿ | ż | ||
| 11000000 | 300 | 192 | C0 | À | Ŕ | À | Ā | Р | ΐ | À | Ā | ภ | Ą | À | À | À | |||
| 11000001 | 301 | 193 | C1 | Á | Á | Á | Á | С | ء | Α | Á | Á | ม | Į | Á | Á | Á | ||
| 11000010 | 302 | 194 | C2 | Â | Â | Â | Â | Т | آ | Β | Â | Â | ย | Ā | Â | Â | Â | ||
| 11000011 | 303 | 195 | C3 | Ã | Ă | Ã | У | أ | Γ | Ã | Ã | ร | Ć | Ã | Ã | Ă | |||
| 11000100 | 304 | 196 | C4 | Ä | Ä | Ä | Ä | Ф | ؤ | Δ | Ä | Ä | ฤ | Ä | Ä | Ä | Ä | ||
| 11000101 | 305 | 197 | C5 | Å | Ĺ | Ċ | Å | Х | إ | Ε | Å | Å | ล | Å | Å | Å | Ć | ||
| 11000110 | 306 | 198 | C6 | Æ | Ć | Ĉ | Æ | Ц | ئ | Ζ | Æ | Æ | ฦ | Ę | Æ | Æ | Æ | ||
| 11000111 | 307 | 199 | C7 | Ç | Ç | Ç | Į | Ч | ا | Η | Ç | Į | ว | Ē | Ç | Ç | Ç | ||
| 11001000 | 310 | 200 | C8 | È | Č | È | Č | Ш | ب | Θ | È | Č | ศ | Č | È | È | È | ||
| 11001001 | 311 | 201 | C9 | É | É | É | É | Щ | ة | Ι | É | É | ษ | É | É | É | É | ||
| 11001010 | 312 | 202 | CA | Ê | Ę | Ê | Ę | Ъ | ت | Κ | Ê | Ę | ส | Ź | Ê | Ê | Ê | ||
| 11001011 | 313 | 203 | CB | Ë | Ë | Ë | Ë | Ы | ث | Λ | Ë | Ë | ห | Ė | Ë | Ë | Ë | ||
| 11001100 | 314 | 204 | CC | Ì | Ě | Ì | Ė | Ь | ج | Μ | Ì | Ė | ฬ | Ģ | Ì | Ì | Ì | ||
| 11001101 | 315 | 205 | CD | Í | Í | Í | Í | Э | ح | Ν | Í | Í | อ | Ķ | Í | Í | Í | ||
| 11001110 | 316 | 206 | CE | Î | Î | Î | Î | Ю | خ | Ξ | Î | Î | ฮ | Ī | Î | Î | Î | ||
| 11001111 | 317 | 207 | CF | Ï | Ď | Ï | Ī | Я | د | Ο | Ï | Ï | ฯ | Ļ | Ï | Ï | Ï | ||
| 11010000 | 320 | 208 | D0 | Ð | Đ | Đ | а | ذ | Π | Ğ | Ð | ะ | Š | Ŵ | Ð | Ð | |||
| 11010001 | 321 | 209 | D1 | Ñ | Ń | Ñ | Ņ | б | ر | Ρ | Ñ | Ņ | ั | Ń | Ñ | Ñ | Ń | ||
| 11010010 | 322 | 210 | D2 | Ò | Ň | Ò | Ō | в | ز | Ò | Ō | า | Ņ | Ò | Ò | Ò | |||
| 11010011 | 323 | 211 | D3 | Ó | Ó | Ó | Ķ | г | س | Σ | Ó | Ó | ำ | Ó | Ó | Ó | Ó | ||
| 11010100 | 324 | 212 | D4 | Ô | Ô | Ô | Ô | д | ش | Τ | Ô | Ô | ิ | Ō | Ô | Ô | Ô | ||
| 11010101 | 325 | 213 | D5 | Õ | Ő | Ġ | Õ | е | ص | Υ | Õ | Õ | ี | Õ | Õ | Õ | Ő | ||
| 11010110 | 326 | 214 | D6 | Ö | Ö | Ö | Ö | ж | ض | Φ | Ö | Ö | ึ | Ö | Ö | Ö | Ö | ||
| 11010111 | 327 | 215 | D7 | × | × | × | × | з | ط | Χ | × | Ũ | ื | × | Ṫ | × | Ś | ||
| 11011000 | 330 | 216 | D8 | Ø | Ř | Ĝ | Ø | и | ظ | Ψ | Ø | Ø | ุ | Ų | Ø | Ø | Ű | ||
| 11011001 | 331 | 217 | D9 | Ù | Ů | Ù | Ų | й | ع | Ω | Ù | Ų | ู | Ł | Ù | Ù | Ù | ||
| 11011010 | 332 | 218 | DA | Ú | Ú | Ú | Ú | к | غ | Ϊ | Ú | Ú | ฺ | Ś | Ú | Ú | Ú | ||
| 11011011 | 333 | 219 | DB | Û | Ű | Û | Û | л | Ϋ | Û | Û | Ū | Û | Û | Û | ||||
| 11011100 | 334 | 220 | DC | Ü | Ü | Ü | Ü | м | ά | Ü | Ü | Ü | Ü | Ü | Ü | ||||
| 11011101 | 335 | 221 | DD | Ý | Ý | Ŭ | Ũ | н | έ | İ | Ý | Ż | Ý | Ý | Ę | ||||
| 11011110 | 336 | 222 | DE | Þ | Ţ | Ŝ | Ū | о | ή | Ş | Þ | Ž | Ŷ | Þ | Ț | ||||
| 11011111 | 337 | 223 | DF | ß | ß | ß | ß | п | ί | ‗ | ß | ß | ฿ | ß | ß | ß | ß | ||
| 11100000 | 340 | 224 | E0 | à | ŕ | à | ā | р | ـ | ΰ | א | à | ā | เ | ą | à | à | à | |
| 11100001 | 341 | 225 | E1 | á | á | á | á | с | ف | α | ב | á | á | แ | į | á | á | á | |
| 11100010 | 342 | 226 | E2 | â | â | â | â | т | ق | β | ג | â | â | โ | ā | â | â | â | |
| 11100011 | 343 | 227 | E3 | ã | ă | ã | у | ك | γ | ד | ã | ã | ใ | ć | ã | ã | ă | ||
| 11100100 | 344 | 228 | E4 | ä | ä | ä | ä | ф | ل | δ | ה | ä | ä | ไ | ä | ä | ä | ä | |
| 11100101 | 345 | 229 | E5 | å | ĺ | ċ | å | х | م | ε | ו | å | å | ๅ | å | å | å | ć | |
| 11100110 | 346 | 230 | E6 | æ | ć | ĉ | æ | ц | ن | ζ | ז | æ | æ | ๆ | ę | æ | æ | æ | |
| 11100111 | 347 | 231 | E7 | ç | ç | ç | į | ч | ه | η | ח | ç | į | ็ | ē | ç | ç | ç | |
| 11101000 | 350 | 232 | E8 | è | č | è | č | ш | و | θ | ט | è | č | ่ | č | è | è | è | |
| 11101001 | 351 | 233 | E9 | é | é | é | é | щ | ى | ι | י | é | é | ้ | é | é | é | é | |
| 11101010 | 352 | 234 | EA | ê | ę | ê | ę | ъ | ي | κ | ך | ê | ę | ๊ | ź | ê | ê | ê | |
| 11101011 | 353 | 235 | EB | ë | ë | ë | ë | ы | ً | λ | כ | ë | ë | ๋ | ė | ë | ë | ë | |
| 11101100 | 354 | 236 | EC | ì | ě | ì | ė | ь | ٌ | μ | ל | ì | ė | ์ | ģ | ì | ì | ì | |
| 11101101 | 355 | 237 | ED | í | í | í | í | э | ٍ | ν | ם | í | í | ํ | ķ | í | í | í | |
| 11101110 | 356 | 238 | EE | î | î | î | î | ю | َ | ξ | מ | î | î | ๎ | ī | î | î | î | |
| 11101111 | 357 | 239 | EF | ï | ď | ï | ī | я | ُ | ο | ן | ï | ï | ๏ | ļ | ï | ï | ï | |
| 11110000 | 360 | 240 | F0 | ð | đ | đ | № | ِ | π | נ | ğ | ð | ๐ | š | ŵ | ð | đ | ||
| 11110001 | 361 | 241 | F1 | ñ | ń | ñ | ņ | ё | ّ | ρ | ס | ñ | ņ | ๑ | ń | ñ | ñ | ń | |
| 11110010 | 362 | 242 | F2 | ò | ň | ò | ō | ђ | ْ | ς | ע | ò | ō | ๒ | ņ | ò | ò | ò | |
| 11110011 | 363 | 243 | F3 | ó | ó | ó | ķ | ѓ | σ | ף | ó | ó | ๓ | ó | ó | ó | ó | ||
| 11110100 | 364 | 244 | F4 | ô | ô | ô | ô | є | τ | פ | ô | ô | ๔ | ō | ô | ô | ô | ||
| 11110101 | 365 | 245 | F5 | õ | ő | ġ | õ | ѕ | υ | ץ | õ | õ | ๕ | õ | õ | õ | ő | ||
| 11110110 | 366 | 246 | F6 | ö | ö | ö | ö | і | φ | צ | ö | ö | ๖ | ö | ö | ö | ö | ||
| 11110111 | 367 | 247 | F7 | ÷ | ÷ | ÷ | ÷ | ї | χ | ק | ÷ | ũ | ๗ | ÷ | ṫ | ÷ | ś | ||
| 11111000 | 370 | 248 | F8 | ø | ř | ĝ | ø | ј | ψ | ר | ø | ø | ๘ | ų | ø | ø | ű | ||
| 11111001 | 371 | 249 | F9 | ù | ů | ù | ų | љ | ω | ש | ù | ų | ๙ | ł | ù | ù | ù | ||
| 11111010 | 372 | 250 | FA | ú | ú | ú | ú | њ | ϊ | ת | ú | ú | ๚ | ś | ú | ú | ú | ||
| 11111011 | 373 | 251 | FB | û | ű | û | û | ћ | ϋ | û | û | ๛ | ū | û | û | û | |||
| 11111100 | 374 | 252 | FC | ü | ü | ü | ü | ќ | ό | ü | ü | ü | ü | ü | ü | ||||
| 11111101 | 375 | 253 | FD | ý | ý | ŭ | ũ | § | ύ | ı | ý | ż | ý | ý | ę | ||||
| 11111110 | 376 | 254 | FE | þ | ţ | ŝ | ū | ў | ώ | ş | þ | ž | ŷ | þ | ț | ||||
| 11111111 | 377 | 255 | FF | ÿ | ˙ | ˙ | ˙ | џ | ÿ | ĸ | ’ | ÿ | ÿ | ÿ | |||||
A la position 0xA0 il y a toujours l'espace « non-breaking » et 0xAD est normalement le trait d'union « soft », qui est seulement montré aux coupures de ligne. Autre champs vides sont soit non attribué soit des caractères que le système utilisé n'est pas capable d’afficher.
Relations avec Unicode et UCS
Depuis 1991, le consortium Unicode a travaillé avec ISO pour développer l’Unicode et ISO/IEC 10646 : la série de caractère universelle (UCS) en tandem. Cette paire de normes a été créée pour unifier le répertoire de caractère ISO 8859, parmi les autres, en assignant chaque caractère au début, à une valeur de code de 16 bits, avec quelques valeurs de code non attribué.
Progressivement, leurs modèles ont adapté pour mapper les caractères aux points de code numériques virtuel au lieu des valeurs de longeur de bits fixes, pour que plus de points de code et méthodes de code puissent être soutenues.
Unicode et l'ISO/IEC 10646 assignent actuellement à peu près 100000 caractères à un espace de code qui consiste en par-dessus de un million de points de code, et ils définissent plusieurs norme code cela est capable de représenter chaque point de code disponible.
La norme de codage Unicode et le UCS utilise des séquences de l'un à quatre codes de 8 bits (UTF-8), les séquences d'un ou deux codes de 16 bits (UTF-16), ou une valeur de code de 32 bits (UTF-32 ou UCS-4). Il y a aussi un plus vieux code qui utilise une valeur de 16 bits (UCS-2), capable de représentant un dix-septième des points de code disponibles. De ces formes codant, seulement les séquences d'octet UTF-8 sont en un ordre fixe ; les autres à l'octet dépendant de la plate-forme entraînant des problèmes qui peuvent être adressés via les codes spéciaux ou indiqué via les moyens hors de bande.
Les plus nouvelles éditions d'ISO 8859 expriment les caractères en termes de leurs noms d'Unicode/UCS et la notation U+nnnn, causant efficacement chaque partie d'ISO 8859 d’être un caractère d'Unicode/UCS, l'arrangement codant qui fait choisir un police d'un très petit sous-ensemble du UCS en octets de 8 bits. Le premier 256 caractères en Unicode et UCS sont identique à ceux en ISO-8859-1.
ISO 8859 a été favorisé à travers les années1990, ayant les avantages d'être bien établi et plus facilement appliqué au logiciel : l'équation d'un octet à un caractère est simple et suffisante pour la plupart d'applications d’une seule langue ou il n'y a pas de caractère combiné ou de formes variantes.
Comme le coût relatif, en ressources de l'informatique, d'utilisation plus qu'un octet par le caractère a commencé à diminuer, les langages de programmation et les systèmes d'exploitation offrent du soutien supplémentaire pour Unicode à côté de leur système de la page de code native. Comme des systèmes fonctionnant rendu capable de Unicode sont devenus plus répandus, ISO 8859 et autres vieux codes sont devenus moins populaires. Pendant que ISO 8859 et les modèles de caractère d’un seul octet restent retranché en beaucoup de systèmes d'exploitation, langages de programmation, systèmes de stockage de données, applications d'établissement de contacts professionnels, du matériel affichant, et du logiciel d'application d'utilisateur final, les applications d'informatique les plus modernes utilisent Unicode intérieurement et compte sur les tables de conversion pour faire un mappage aux plus simples codes quand nécessaire.
État de développement
Le norme ISO/IEC 8859 était mis à jour par la groupe ISO/IEC Joint Technical Committee 1, Subcommittee 2, Working Group 3 (ISO/IEC JTC 1/SC 2/WG 3) mais en juin 2004, WG 3 est étient et ses taches donnés au groupe SC 2. Le norme n'est plus en train d'être mis à jour car la seule groupe de travaux active, WG 2, doit se concentrer au developpement de ISO/IEC 10646.
Références
- Les copies des versions publiées des normes sont à vendre au ISO catalogue site et au ANSI eStandards Store.
- Les versions PDF des propositions finales de quelques sections d'ISO/IEC 8859 comme soumis pour revue & publication par ISO/IEC JTC 1/SC 2/WG 3 se trouvent au site WG 3 :
- ISO/IEC 8859-1:1998 - 8-bit single-byte coded graphic character sets, Part 1: Latin alphabet No. 1 (draft dated February 12, 1998, published April 15, 1998)
- ISO/IEC 8859-4:1998 - 8-bit single-byte coded graphic character sets, Part 4: Latin alphabet No. 4 (draft dated February 12, 1998, published July 1, 1998)
- ISO/IEC 8859-7:1999 - 8-bit single-byte coded graphic character sets, Part 7: Latin/Greek alphabet (draft dated June 10, 1999; superseded by ISO/IEC 8859-7:2003, published October 10, 2003)
- ISO/IEC 8859-10:1998 - 8-bit single-byte coded graphic character sets, Part 10: Latin alphabet No. 6 (draft dated February 12, 1998, published July 15, 1998)
- ISO/IEC 8859-11:1999 - 8-bit single-byte coded graphic character sets, Part 11: Latin/Thai character set (draft dated June 22, 1999; superseded by ISO/IEC 8859-11:2001, published Dec 15, 2001)
- ISO/IEC 8859-13:1998 - 8-bit single-byte coded graphic character sets, Part 13: Latin alphabet No. 7 (draft dated April 15, 1998, published October 15, 1998)
- ISO/IEC 8859-15:1998 - 8-bit single-byte coded graphic character sets, Part 15: Latin alphabet No. 9 (draft dated August 1, 1997; superseded by ISO/IEC 8859-15:1999, published March 15, 1999)
- ISO/IEC 8859-16:2000 - 8-bit single-byte coded graphic character sets, Part 16: Latin alphabet No. 10 (draft dated November 15, 1999; superseded by ISO/IEC 8859-16:2001, published July 15, 2001)
- Les normes ECMA, écrit avec l'intention de correspondance exacte au normes de polices de charactères ISO/IEC 8859, se trouve au:
- Standard ECMA-94: 8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986)
- Standard ECMA-113: 8-Bit Single-Byte Coded Graphic Character Sets - Latin/Cyrillic Alphabet 3rd edition (December 1999)
- Standard ECMA-114: 8-Bit Single-Byte Coded Graphic Character Sets - Latin/Arabic Alphabet 2nd edition (December 2000)
- Standard ECMA-118: 8-Bit Single-Byte Coded Graphic Character Sets - Latin/Greek Alphabet (December 1986)
- Standard ECMA-121: 8-Bit Single-Byte Coded Graphic Character Sets - Latin/Hebrew Alphabet 2nd edition (December 2000)
- Standard ECMA-128: 8-Bit Single-Byte Coded Graphic Character Sets - Latin Alphabet No. 5 2nd edition (December 1999)
- Standard ECMA-144: 8-Bit Single-Byte Coded Character Sets - Latin Alphabet No. 6 3rd edition (December 2000)
- Les tables de mappage ISO/IEC 8859-1 à Unicode mapping tables en fichiers de texte ordinaire se trouvent au site FTP de Unicode.
- Les descriptions informelles et les tables de code pour la plupart des normes ISO 8859 se trouvent au ISO 8859 Alphabet Soup (Miroir)
