Wpis z mikrobloga

Skopiuj link

27.05.2021, 11:24:20

Cześć #machinelearning. Mam zbiór około 80 tys. notatek - średnio każda ma stronę A4. Chciałbym analizować czy coś jest fake newsem czy nie, korzystając z modelu BERT do #nlp. I mam pytanie czy dobrze rozumiem jak to miałoby działać: tokenizuje notatke, dodaje te tokeny specjalne cls i sep, zamieniam to na wektory wrzucam w berta i dostaje w outpucie tez wektory. To dopiero muszę wsadzić do np. modelu regresji logistycznej? Czy jest szansa potem na jakąś sensowną analize tego? Bo czysto teoretycznie BERT działa jak czarna skrzynka, ale czytałem że są takie metody jak Integrated Gradient czy tsne żeby zobaczyć na jakie słowa model zwracał bardziej uwagę, ale czy dla tak długich notatek się to sprawdzi? Dzięki za podpowiedzi! (ʘ‿ʘ)

#programowanie #programista15k #naukaprogramowania #bigdata #sztucznainteligencja #deeplearning #python

blazek

U.....t

konto usunięte 27.05.2021, 11:39:42

Komentarz usunięty przez autora

TheRickestRick

27.05.2021, 11:44:43 via Wykop Mobilny (Android)

@UnderratedMoviesBot: no właśnie chyba wkopałem się w ciężki temat bo tu dużo zależy od zbioru danych sensownego o który raczej ciężko, ale jak jesteś ciekawy to mogę ci podesłać pracę na ten temat, z której trochę skorzystałem

U.....t

konto usunięte 27.05.2021, 12:40:03

Komentarz usunięty przez autora

TheRickestRick

27.05.2021, 12:46:30

@UnderratedMoviesBot: https://arxiv.org/pdf/1905.04749.pdf

konto usunięte

mrocznapszczola

27.05.2021, 23:40:24

Masz rozpoznać czy coś jest prawdą lub fałszem. W takim razie bierzesz model_A (w tym przypadku BERT), ten model generuje ci wektor X^n dla każdej notatki. Teraz pozostaje Ci tylko zrobić klastrowanie/porównianie przy pomocy jakiejś metryki czy dana notatka ze zbioru testowego jest fakiem czy nie. Radzę jednak otagować trochę danych przynajmniej w zbiorze testowym :)

TheRickestRick

31.08.2021, 16:12:20

@mrocznapszczola: przerpaszam, że nie odpisałem i nie podziękowałem, gdzieś mi umknęło (－‸ლ)

Aktywne Wpisy

dzikiwonsz21

dzikiwonsz21 +8

3 godz. i 10 min temu

Ale kupiłem gruza, ja #!$%@? XD
Ogólnie to aż się zastanawiam czy tego po prostu nie sprzedać na części czy do jakiegoś komisu, bo mechanik mi pewnie sporo krzyknie.
Kupiłem alfę 166, 2.4 jtd 136km a niżej lista "drobnostek" których Janusz sprzedaży mi nie opowiedział. Jak gadałem z nim przez telefon to mówił że jedynie tylnie zawieszenie i radio do zrobienia, a reszta jest super XD

Ogólnie to mam nadzieję, że za

Wo0cash

Wo0cash +180

2 godz. i 19 min temu

#!$%@?, #!$%@?ć ten świat.
Ten chłopiec powinien jak każde dziecko żyć, rozwijać się, bawić się ze swoimi kolegami....
Ale nie będzie miał tej możliwości, bo chore "ambicje", czy zapędy imperialistyczne starego dziada muszą być spełnione, a życie ludzi to sprawa bez znaczenia.
I mało tego, są ludzie którzy mu w tym wtórują, ślepo wierząc w idę....sam nie wiem czego
Dziwny jest ten świat (╯︵╰,)
#wojna #ukraina #swiat

Wo0cash - #!$%@?, #!$%@?ć ten świat.
Ten chłopiec powinien jak każde dziecko żyć, roz... — **źródło:** temp_file7337849322692185902
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Podoficer na czterech łapach. ETO bohaterem nietypowego awansu w armii

Kiedy policjant narazi się na przedawkowanie fentanylu.

Ukraina Ruch oporu Atesz: zniszczono rosyjski rurociąg na Krymie

Ty robaku likwiduj kotły gazowe a my budujemy nowe bloki na gaz!

PŚ Lahti: historyczne podium Aleksandra Zniszczoła!

Popularne tagi