Wpis z mikrobloga

Skopiuj link

24.02.2024, 19:05:55

#programista15k #programowanie #it #sztucznainteligencja #chatgpt #datascience

Dla wszystkich zainteresowanych data science/ai, 4 dni temu Karpathy wypuścił świetne video,
w którym pokazuje jak zbudować Tokenizer od zera.

https://youtu.be/zduSFxRajkE?si=TjRhcwFlxm2yvULH

Tokenizer to bardzo istotny element pipelinu nlp, który służy do konwertowania tekstu na sekwencję tokenów, tworzenia liczbowej reprezentacji tokenów i łączenia ich w tensory.

Prosty przykład zdania: "Wykopki to najlepsi ludzie pod słońcem"

Etap 1 (Podział na mniejsze części): "Wykopki", "to", "najlepsi", "ludzie", "pod", "słońcem"

Etap 2 (Przekształcenie na numery, tutaj fikcyjne, pochodzące z wytrenowanych wcześniej wielkich korpusów): "Wykopki" -> 12345, "to" -> 67, "najlepsi" -> 8910, "ludzie" -> 1112, "pod" -> 1314, "słońcem" -> 1516

Etap 3 (Dodanie specjalnych znaczników, pozwalają one na określenie początków i końców zdani): Początek zdania -> 101, Koniec zdania -> 102

Etap 4 (Wynik końcowy): 101, 12345, 67, 8910, 1112, 1314, 1516, 102

Podstawowy pipeline nlp, np. przy użyciu architektury Huggingface można sobie przeklikać tutaj:

https://colab.research.google.com/github/huggingface/notebooks/blob/main/transformers_doc/en/preprocessing.ipynb

barber-barberski

26.02.2024, 00:56:52 via Wykop

@JamesJoyce: Po takie treści właśnie zacząłem lurkować wykop te N lat temu, dzięki za ratowanie poziomu, a nie tylko chwalenie się kasą lub narzekanie na kryzys.

JamesJoyce

Aktywne Wpisy

mirko_anonim

mirko_anonim +37

5 godz. i 54 min temu

✨️ Obserwuj #mirkoanonim
Nie mam komu o tym opowiedzieć, a chciałam się z kimś podzielić moją historią. Piszę z anonimowych bo mam tu konto od kilku lat, a nie chcę być wyzywana przez wykopków od dzi*ek.

Tl;dr Niedługo biorę ślub z mężczyzną którego poznałam na PornHubie
Więc... w 2018 zaczęłam nagrywać filmiki dla dorosłych. Szczerze mówiąc, wynikało to wyłącznie z mojej niskiej samooceny i depresji. Chciałam po prostu poczuć się dowartościowania, więc

Showse

Showse +351

2 godz. i 58 min temu

W Anglii w czasach wiktoriańskich najtańszą formą zakwaterowania było "Penny hang", czyli spanie na linie za grosz. W Polsce można by rozszerzyć pomysł starych anglików i wprowadzić "Linostówki" inwestycyjne w pobliżu korpo lub zakładów produkcyjnych.
#nieruchomosci

Showse - W Anglii w czasach wiktoriańskich najtańszą formą zakwaterowania było "Penny... — **źródło:** temp_file1273358334516023824
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Płonie Połonina Caryńska w Bieszczadach

Katowice. Duży pożar hali Farmacol. Interweniują strażacy

Wyciek danych z ZUS, w tym numerów PESEL. "Mailem na prywatny adres"

Alarm! Polaków w dramatycznym tempie zacznie ubywać

Rodzina K. pozostaje w areszcie

Popularne tagi