Wpis z mikrobloga

Skopiuj link

14.07.2020, 04:07:32

Treść przeznaczona dla osób powyżej 18 roku życia...

konto usunięte 14.07.2020, 04:32:21

@Sinity: szkoda, że model nie jest ogólnodostępny na licencji mit, bo by zaoszczędził mi jakiś rok pracy...

Ale wtedy pisowskie trollw podbiłyby twittera do końca...

A.....5

konto usunięte 14.07.2020, 04:43:15

@Sinity: swoją drogą wiele technik NLP zwraca/korzysta z uniwersalnych modeli.

Google Translate ma pod spodem model w 'sztucznym' języku, a badania nad word2vec'iem wykazały, że dane słowa oraz ich tłumaczenia, jeśli wyuczysz model na korpusach różnych języków, będą blisko siebie w wygenerowanej przestrzeni.

Sinity

14.07.2020, 05:29:43

@AlBundy95: No szkoda że nie udostępniają. Nawet API na razie jest zamknięte (i niestety ale nie dali dostępu na podstawie "bo chce się tym pobawić" ani "jestem studentem"; nie żebym oczekiwał że to zadziała)

Nie wiem do czego tego potrzebujesz; ale możliwe jest że albo to przyszłe API albo nawet AI Dungeon by wystarczyło? AI Dungeon to teoretycznie "gra" ale w praktyce można wrzucić dowolnego prompta (jak tutaj); tyle że

Sinity

14.07.2020, 05:40:20

@AlBundy95: To o czym mówisz w sumie nie jest zaskakujące; nie ma nic specyficznego dla j. ang. w metodzie trenowania, więc jeśli dane treningowe zawierały sensowną ilość tekstu w innych językach to jak najbardziej powinno to działać. Nie spodziewałem się że na tyle polskiego tam rzeczywiście będzie.

Chociaż w sumie zasada jest raczej inna niż opisałeś w tym przypadku; GPT ma przewidywać kolejne tokeny na podstawie kontekstu ("poprzedniego" tekstu). Więc

A.....5

konto usunięte 14.07.2020, 05:59:47

Word2Vec to trochę coś innego, niż rozwiązania podobne do GPT. Natomiast założenia poczynione przy konstruowaniu są podobne.

Word2Vec zwraca wektory per słowo. Przestrzeń, w której znajdują się wektory, generowana jest na podstawie powiązań między słowami w tekście. I teraz w zależności od podejścia (główne to są skipgram i cbow, w skrócie przewidywanie słowa na podstawie otoczenia lub przewidywanie otoczenia na podstawie słowa) uczy się w różny sposób. Cechą takich wektorów jest to,

Sinity

14.07.2020, 06:19:44

@AlBundy95: Jasne; trochę koślawo napisałem to co miałem na myśli; w zasadzie chodziło mi tylko o to że znajomość polskiego przez GPT-3 nie powinna być zaskakująca gdy metoda uczenia nie jest zależna od samego j. ang. - jak dane są w różnych językach to można spodziewać się podobnej poprawności w j. innych niż ang.

Tak, wg. sposobu działania który opisujesz rzeczywiście "łatwiej" o niezależność od języka.

PS: nie spodziewałem się

gekon_polepositionowy

14.07.2020, 06:44:38

Główne hasło kampanii to: "Byłem, jestem, będę".

@Sinity: piękne :D

Sinity

14.07.2020, 06:53:21

@gekon_polepositionowy: W sumie powiem ci że nad tym hasłem się głębiej nie zastanowiłem wcześniej. A ono przypisane do Dudy jest przerażające & trafne.

Aktywne Wpisy

5 godz. i 48 min temu

Jak się czujecie z tym, że u nas w 99% robi się OUTSOURCING I CRUDY. Nie masz szans na ciekawe wyzwania inzynieryjne. U nas nie ma R&D w programowaniu. Musisz celować w jakieś AI/ML stanowiska albo cybersecurity, całkowicie inna działka niż: web-dev, dev, devOps, testy, cloud architect itd.

W devie ciągle tylko klepanie - @RestController, @autowired, @Trasanctional, RESTy, CRUDy, Kafki, Redisy, Elasticsearche. S3 i Lambdy. Kubernetesy. Robota

Aktywne Wpisy

Aktywne Znaleziska

P-----c wobec mężczyzn. Ofiary cierpią w ciszy.

Tragiczny wypadek na Pomorzu, 10-latek nie żyje

Bollywood robi film w Gdańsku i za pomocą także ochrony SERIS warczy na mieszkań

"Kara niewspółmierna do czynu". Rusza proces kierowcy, który wjechał w 14-latkę

Mąż policjantki potrącił dziewczynkę na pasach. Dostał tylko grzywnę. Teraz jest

Popularne tagi