Wykop udostępnił Naukowej i Akademickiej Sieci Komputerowej (NASK) zbiór komentarzy zawierających ofensywne i szkodliwe komentarze usunięte wykopu. W wielkim skrócie można sobie przejrzeć co "profesjonalni moderatorzy" wykopu usuwają.

The repository contains the first publicly available dataset of offensive and harmful content banned from a web service Wykop.pl (often called the "Polish Reddit") by professional moderators. Thanks to the Wykop owners, the banned posts and comments have been reclaimed and preprocessed for public
sokytsinolop - Wykop udostępnił Naukowej i Akademickiej Sieci Komputerowej (NASK) zbi...

źródło: PB2h3L1

Pobierz
Ech... kolejny klient który coś chce ale nie dostarcza danych (bo nie może)... nie mogę wiele napisać, aaaale możecie się domyślić z tego dość chaotycznego wpisu.
Potrzebuję zdjęć kobiecych piersi wraz z ich rozmiarem, najlepiej jakby to były zdjęcia z różnych ujęć, mogą być zakryte ale lepiej żeby były też odkryte. Zdjęcia mają posłużyć do... wytrenowania AI, bo się klient nasłuchał, że to teraz modne, to on chce mieć taki automagiczny wykrywacz
  • 2
@MilionoweMultikonto: @czworokot Koniec końców, przygotowałem mu gotowiec (oparty o ResNet50), powiedziałem jak to odpalić, jak wytrenować i jak dotrenowywać oraz przygotowałem opis jak przygotować dataset. Na tej podstawie klient może sobie samemu wytrenować tą sieć oraz dotrenowywać. Także doszliśmy do kompromisu, ja zadowolony bo problem rozwiązany, klient też bo będzie miał swój upragniony model AI (którego IMO nie potrzebuje, no aaale...). Jedyne co będziemy konsultować to wykresy uczenia, także no... happy
Mozilla dnia 2020-06-22 wydała następne wersje datasetów z nagraniami.

Pojawiła się też możliwość pobrania j. polskiego.
https://commonvoice.mozilla.org/pl/datasets

Przy pobraniu

Zgadzasz się, że nie będziesz próbować ustalać tożsamości osób mówiących w zbiorze danych Common Voice


#mozilla #commonvoice #bigdata #datascience #zbiordanych #dataset #programowanie #programista15k
patrolez - Mozilla dnia 2020-06-22 wydała następne wersje datasetów z nagraniami.

...

źródło: comment_1597064236UBubZzMCWTh6WnmZxcncKT.jpg

Pobierz