[ENG] Znaki, symbole i "cud" którym jest UTF-8
Ludzie z Computerphile opowiadają o tym dlaczego widzimy coraz mniej "krzaczków" w internecie, przyczynach powstania Unicode oraz o sposobie działania UTF-8.
Szczur90 z- #
- #
- #
- #
- 35
Ludzie z Computerphile opowiadają o tym dlaczego widzimy coraz mniej "krzaczków" w internecie, przyczynach powstania Unicode oraz o sposobie działania UTF-8.
Szczur90 z
Komentarze (35)
najlepsze
@qwertyu: Komputery są zbudowane w taki sposób, ƶe mogą efektywnie operować na pamięci o rozmiarach 8,16 i 32 bitów*. Wszystko inne jest znacznie mniej wydajne, dlatego jeśli nie zmieścili się w 16 bitach (65536 kombinacji) musieli przejść na 32.
* 64-bitowy kod moƶe operować na zmiennych 64-bitowych, ale tego praktycznie nie było podczas tworzenia unicode, poza tym, 64 bity to znaczny overkill jeśli
Trochę pogmatwałem ale mam nadzieję, ze zrozumiesz mój tok rozumowania :)
EDIT: Tutaj masz bardzo ładną tabelkę
Nie jestem specem, ale może mi ktoś wyjaśnić, jaki to ma sens poza pożeraniem większej ilości RAMu?..
UTF8: Variable-width encoding, backwards compatible with ASCII. ASCII characters (U+0000 to U+007F) take 1 byte, code points U+0080 to U+07FF take 2 bytes, code points U+0800 to U+FFFF take 3 bytes, code points U+10000 to U+10FFFF take 4 bytes. Good for English text, not so good for Asian text.
UTF16: Variable-width encoding. Code points U+0000 to U+FFFF take 2 bytes, code points U+10000 to U+10FFFF take 4 bytes. Bad for