Wpis z mikrobloga

Ale widzisz że 6 bajtowe działają ☃️,


@K-S-: to dzięki sekwencji codepointów Unicode, a nie przez same "wysokie" codepointy. Unicode jest bardzo złożonym standardem.

Czyli graficzny snowman, to sekwencja [3 bajty, 3 bajty].

Najmniejszą niepodzielną logiczną jednoską kodującą są tzw. codepoint i ich sekwencje mogą mieć specjalne znaczenia, ale mogą też istnieć np. równoznaczne pojedyncze codepointy, które będą tak samo wyglądać niczym sekwencja.

➡️ https://unicode.org/reports/tr15/

Np. są też specjalne sekwencje
Czyli graficzny snowman, to sekwencja [3 bajty, 3 bajty].

@K-S-: a dokładniej sekwencja codepointów: [U+2603, U+FE0F].

https://stackoverflow.com/questions/38100329/what-does-u-ufe0f-in-an-emoji-mean-is-it-the-same-if-i-delete-it

Samo U+2603 daje ☃, ale różne silniki renderujące czcionki mogą to wyświetlić jako graficzna lub tekstowa forma.

Po dodaniu U+FE0F jako następny codepoint, to zostaje interpretowane jako specjalna sekwencja i zmienia się w graficzną wersję ☃️

Po dodaniu U+FE0E jako następny codepoint, to zostaje interpretowane jako specjalna sekwencja i jest zagwarantowane do pozostania tekstową