Jak pochopne wnioskowanie na podstawie średniej i wariancji może zmylić
Kilkusekundowy klip przestrzega przed pochopnym wnioskowaniem statystycznym. Wiele rozkładów punktów ma praktycznie takie same statystyki niższego rzędu (średnie, odchylenia standardowe, czy korelacje), a przedstawiają zupełnie inne wzory. Źródło: twitter.com/docmilanfar/status/1400276401513648143
kondiz z- #
- #
- #
- #
- #
- 79
Komentarze (79)
najlepsze
Każdy, kto miał cokolwiek wspólnego z analizą danych wie, że zanim zacznie się cokolwiek liczyć to trzeba dane ZOBACZYĆ. Wiadomo, że na tyle, na ile to możliwe - ale z drugiej strony jak masz przed sobą jakąś hiper-wielką chmurę danych która ma x wymiarów to używasz wtedy innych sposobów na "zobaczenie" niż wykresy rozrzutu. No i oczywiście
https://pl.m.wikipedia.org/wiki/Kwartet_Anscombe%E2%80%99a
Są nawet testy statystyczne, które sprawdzają, czy dane mają rozkład normalny.
Od ich wyniku zależy to, jakie testy mogą być stosowane w dalszej analizie.
@powaznadecyzja: używasz wtedy innego wzoru na model i robisz porównanie podobnie, kwestia skilla
Komentarz usunięty przez moderatora
Tutaj jednak dane nie są z rozkładu normalnego i dlatego "dzieją się takie cuda".
@TomaszA2: pierwszy lepszy przykład: we wiosce "A" jest 100 osób które pracują za 1000zł/msc i jedna która zarabia 1mln/msc a w wiosce "B" 60 osób zarabia 1000zł/msc a 40 osób 25000zł/msc. W obu przypadkach zarówno średnia jak i dominanta będą takie same a jednak w wiosce "B" jest więcej osób które zarabiają dużo ( ͡° ͜ʖ ͡°) gdyby rozrysować
Komentarz usunięty przez moderatora
Teraz kazdy jest data scientist i software engineer.
Durne z HR oczywiscie kupia kazde gowno, bonwiedza... gow...o.
A ludzie co sie NIE bawia w HR i uderzaja bezposrednio poza tymi lezb...mi,, zgarniaja w tej dziedzinie po 500 USD dziennie, zdalnie.
Zyj z tym.
;)