Wpis z mikrobloga

Ahoj #machinelearning i #datascience!. Czy są tutaj osoby początkujące? Specjalnie z myślą o was napisałem artykuł, w którym wypisuję i omawiam elementy projektu machine learning, które warto sobie przemyśleć i wybrać jeszcze przed rozpoczęciem pracy. Idea jest taka, że dzięki podjęciu tych decyzji, nawet osoba początkująca będzie miała szansę doprowadzić taki projekt do końca. Miłej lektury:

https://www.jakbadacdane.pl/jak-zaczac-dzialac-w-uczeniu-maszynowym/

#jakbadacdane
  • 7
@sebek910: Siema. Tego akurat jeszcze nie wiem. Jeśli miałbym zgadywać, to powiedział bym, że pewnie tak, pytanie tylko po co? No bo jak już skalujemy wejście, to raczej po to, żeby operować tymi samymi rzędami wielkości. A różne skalery mogły bo to zepsuć. Nie?
@Avitus: ale chodzi mi o zniwelowanie efektu outliners tzn. wartosci totalnie poza skala. Jak wiemy rozne scalery maja rozny wplyw i stopien tego efektu w zaleznosci od rozkladu wejsciowych. Interesuje mnie czy takie roznicowanie jest mozliwe np.minmaxscaler do kilku inputow, a inny scaler do jakiegos innego inputu
@sebek910: Możliwe jest jak najbardziej, no bo robisz je w innym momencie niż trenowanie. Pytanie tylko czy np. jeśli wiek klienta będziesz skalował inaczej niż wiek nieruchomości to nie zepsujesz sobie danych ;)