Wpis z mikrobloga

takie tagi zajmowałyby 2x więcej miejsca

@cecyl: Kto Ci takie informacje sprzedał? Pan nauczyciel informatyki? UTF-8 coś Ci mówi?
Zresztą nawet zakładając, że masz rację (i tagi musiałyby być trzymane z kodowaniem UTF-16 albo nawet UTF-32), to co to zmienia? Każdy obrazek wrzucony na wypok, czy też każdy wpis zawiera rząd wielkości więcej danych. Przestań myśleć kategoriami średniowiecza, które skąpiło na bajtach, bo się w zamku nie mieściły.
@zakowskijan72: utf8 znak ma do 4 bajtów. Polski ma dwa. Zrób sobie na uspokojenie tablicę 1mln x 5k intów.
Edit:
Jakbyś dał utf8 na tagach to byś miał meksyk tutaj albo musiał dodać walidację dodatkową (ograniczenie tablicy znaków). A tak slug urla jest tagiem - i szukanie szybsze i mniej danych i zwyczajowo.
5k intów.

@cecyl: Intów jakich? Szesnastobitowych? Trzydziestodwubitowych? Sześćdziesięcioczterobitowych?
Poza tym biedny informatyczny pierwszoklasisto, po grzyba mi taka tablica? Co mam indeksować? Jakie wartości przechowywać? I... po co?