Wpis z mikrobloga

Pomagam pewnemu człowiekowi w pisaniu pracy magisterskiej i w ramach tego zajmuję się tworzeniem modelu, który miałby klasyfikować firmy na podstawie ich finansowych współczynników. Problem jest taki, że jeden współczynnik w regresji logistycznej okazuje się być statystycznie nieistotnym. Ponadto, człowiek, który zlecił mi to zadanie mówi, że to bardzo ważne aby jednak był istotny, ponieważ w innym przypadku to wpłynie negatywnie na resztę prac (pisanie pod tezę). I tutaj mam pytanie - czy jest jakikolwiek sposób by uczynić te dane istotnymi? Chciałbym po prostu rozwiać moje wątpliwości co do tego, że jestem w stanie coś zrobić jeszcze.

#statystyka
  • 6
@NieJestemAgentemBialkova: istotność statystyczna nie jest jakimś magicznym progiem, powyżej którego mamy gówno prawdę, a poniżej - prawdę objawioną. 5% próg ufności jest kwestią czysto umowną - oznacza on, że akceptujemy do 5% szans na to, że popełnimy błąd I rodzaju (ten błąd oznacza, że uznaliśmy, iż znaleźliśmy prawdziwą zależność/różnicę/korelację, która tak naprawdę jednak nie występuje).

Jeśli p dla określonego czynnika wyszło 0.051 czy tam 0.06 - po prostu podaj ten wynik,
@NieJestemAgentemBialkova: no to może estymacja nieliniowa? Jeśli robisz to w statistice, jest taka opcja. Być może zależność nie jest możliwa do określenia prosty y=ax+b, tylko wymaga bardziej skomplikowanego wzoru.

Jeśli czynnik X nie ma rozkładu normalnego, możesz je spróbować zlogarytmować.

Jeśli mimo tych zabiegów nic nie wychodzi - naprawdę, ze względu na zwykłą, naukową uczciwość kolega niech pisze, że wyniki odbiegają od pierwotnych założeń - i opisze dlaczego tak mogło być.