Wpis z mikrobloga

Skopiuj link

27.02.2022, 18:07:46

Potrzebuje opinii kogoś bardziej doświadczonego jeśli chodzi o radzenie sobie z imbalanced data. Regresja logistyczna. Mam zbiór danych z 4000 wierszy (przed podziałem train test split) i w tym zbiorze jest tylko 16% wartości 1 wiec zbiór danych jest niezbalansowany. I tutaj mam pewne wątpliwości:

1.Czy metody SMOTE używamy przed podziałem zbioru na treningowy i testowy?
2.Co w przypadku gdy po upsamplingu SMOTE (zrobionym na zbiorze testowym) otrzymujemy dla modeli niższe accuracy niż bez tego upsamplingu?
3. Wszystkie rady będą mile widziane :)

Poniżej sposób jakim zrobiłem upsampling:
s = SMOTE(samplingstrategy = 1, randomstate=1)
Xtrainsmote, ytrainsmote = s.fitresample(Xtrain, y_train.ravel())

#datascience

dmm1234

fidd27

27.02.2022, 18:42:26

Najpierw split, potem SMOTE

https://kiwidamien.github.io/how-to-do-cross-validation-when-upsampling-data.html

@srutownik:

mrocznapszczola

28.02.2022, 09:17:19

@srutownik: dużo zależy od tego jak wyglądają dane czy można je łatwo podzielić nawet w przestrzeni 2/3d ewentualnie usunąć te cechy które powoduja największe anomalie. Sama metoda SMOTE pomoże, ale zasadnicza hipoteza którą powinieneś zbadać to:
"Czy moje dane można w łatwy sposób podzielić w przestrzeni, a jeśli nie to które zmienne powodują największe anomalie"

Zacząłbym od takiego założenia, 16% to jednak dosyć dużo i powinno być widać wizualnie ile jesteś

srutownik

28.02.2022, 10:13:00

@mrocznapszczola: czyli detekcja outlierów najpierw zrobić?

mrocznapszczola

28.02.2022, 10:15:48

@srutownik: Zacznij od porządnej analizy danych a później weź sie za algorytmy klasyfikacji. Jeśli stwierdzisz w trakcie analizy, że dane są mało spójne tzn. posiadają dużo szum to musisz go usunąć i dopiero później stwiedzić czy potrzebujesz metod rozszerzania danych.

Aktywne Wpisy

przemek-cipinski

przemek-cipinski 0

5 godz. i 12 min temu

Trzy miesiące temu ja i moja dziewczyna wyjechaliśmy do pracy do Holandii jako para, oczywiście mamy swój pokój, ale z racji tego że mieszkamy w kontenerach to też mamy współlokatorów za ścianą. Sytuacji kiedy jesteśmy sami jest niewiele, albo jesteśmy w pracy albo w domu wraz ze współpracownikami. Czy waszym zdaniem w takiej sytuacji da się uprawiać seks?

#pytanie #emigracja #seks #zwiazki #holandia #zalesie #przegryw #pracazagranica

janciopan

janciopan +45

6 godz. i 22 min temu

#wojna #ukraina #polska

Kiedyś jak byłem dzieciakiem to się zastawiałem jak to mogło być z tymi nazistami i 2 wojną, jak to mogło być z tymi komunistami. Jak mogły się dziać takie rzeczy i nikt jakoś szczególnie nie reagował.

Zawszę te historię traktowałem jako lekko surrealistyczne bo jak te wszystkie rzeczy mogłby się wydarzyć. Niby wiedziałem, że to prawda ale jakoś nie mogłem zinternalizować tego sobie.

Byłem wychowany w duchu demokracji, unii

Aktywne Wpisy

Aktywne Znaleziska

Blokada polsko-ukraińskiej granicy. Zapowiada ją jedna z rolniczych organizacji

Paragwaj. 32-tygodniowa dziewczynka ożyła na własnym pogrzebie...

Zakaz dla Google. Bezprecedensowy wyrok polskiego sądu

Największy skandal pedofilski. Kuria broni biskupa.

Radio ZET przeprasza i usuwa skandaliczny tekst o Krzysztofie Stanowskim…

Popularne tagi