Windows-1251
874 | Thai |
932 | Japanisch |
936 | Vereinfachtes Chinesisch |
949 | Koreanisch |
950 | Traditionelles Chinesisch |
1200 | Unicode UTF-16, little endian |
1201 | Unicode UTF-16, big endian |
1250 | Mitteleuropäisch |
1251 | Kyrillisch |
1252 | Westeuropäisch |
1253 | Griechisch |
1254 | Türkisch |
1255 | Hebräisch |
1256 | Arabisch |
1257 | Baltisch |
1258 | Vietnamesisch |
12000 | Unicode UTF-32, little endian |
12001 | Unicode UTF-32, big endian |
65000 | Unicode UTF-7 |
65001 | Unicode UTF-8 |
Windows-1251 (auch Codepage 1251, kurz cp1251) ist eine 8-Bit-Zeichensatztabelle zur Darstellung von Sprachen im kyrillischen Alphabet wie Russisch oder Ukrainisch. Sie wird auch häufig für Bulgarisch verwendet.
Windows-1251 und KOI8-R (oder seine ukrainische Variante KOI8-U) sind viel weiter verbreitet als ISO 8859-5[1]. Zukünftig könnten sie durch UTF-8 (Unicode) verdrängt werden. Im März 2022 verwenden 0,6 % aller Websites Windows-1251, ISO-8859-5 wird von weniger als 0,05 % verwendet.[2]
Tabelle
SP (space) auf Position 2016 ist das Leerzeichen, NBSP (no-break space, auch non-breaking space) auf Position A016 ist das geschützte Leerzeichen und SHY (soft hyphen) an Position AD16 ist der bedingte Trennstrich, der normalerweise nur am Zeilenende sichtbar ist.
Einzelnachweise und Quellen
- ↑ Roman Czyborra: The Cyrillic Charset Soup. 1998, abgerufen am 6. März 2022 (englisch).
- ↑ Comparison of the usage statistics of Windows-1251 vs. ISO-8859-5 for websites. In: W3Techs. 6. März 2022, abgerufen am 6. März 2022 (englisch).
Weblinks
- Microsoft Windows Codepage : 1251 (Cyrillic). Microsoft, archiviert vom am 7. Oktober 1999 (englisch).
- cp1251 to Unicode table. Unicode-Konsortium, 15. April 1998 (englisch).
- Petko Yotov: Universal Cyrillic decoder. (englisch, eine Anwendung, die helfen kann, verschieden codierte kyrillische Texte lesbar zu machen).