Wpis z mikrobloga

hai
need #pomocy
Dotyczy #statystyka #ekonometria i ogólnie #excel
Mam zbadać metodami statystycznymi, jak zmienność jednej danej wpływa na zmienność innych danych (tych innych mam 2), okres 8 lat, dane kwartalne, wszystko już ładnie w excelu przygotowałem do pracy na danych
Akurat jest tak, że gdy ta pierwsza dana się zmieni, druga zmienia się w podobny sposób po kilku kwartałach.
Badanie mam zrobić do #pracamagisterska , więc sama korelacja nie wystarcza, potrzeba zrobić badanie jeszcze kilkoma metodami statystycznymi - i tu nie z każdej musi wyjść wynik idealny, byle użycie danej metody było potwierdzone logiką.
Tylko że ja ze staty akurat jestem kulawy, stąd prośba o pomoc.
Jeśli ze statą jesteś za pan brat i już czytając tą wiadomość masz wizję jak to zrobić, pisz priv. Jest okazja zarobić #cebuliony (przy rozbudowanej współpracy, do dogadania) ( ͜͡ʖ ͡€)
  • 3
@kris12151: a jak ci wyjdzie analiza charakterystyk tych danych? np rozkład zmiennych? czy pomiędzy rozkładami wystąpią podobieństwa
druga rzecz która na szybko przychodzi mi do głowy to grupowanie danych (nawet na całym zbiorze) w formie klasteryzacji albo kwantyzacji i badanie rozkładu klastrów
korelacja jest fajnym parametrem ale, jak to w statystyce, śmierdzi
pytanie jak zostały przygotowane dane, czy są w nich błędy, jak zostały oczyszczone itp itd
@hesar: Mein Fuhrer, melduję, że dane nie przeszły przez żadną, powtórzę, żadną, obróbkę statystyczną, stoją w szeregu, zwarcie w kolumnach komórek Excela, przybyły kilka dni temu z marchii danych NBP i czekają na rozkazy.
W gwoli przybliżenia sprawy dodam, iż dane, które się zmieniają i na podstawie ich zmiany badam zmianę innych danych, to te pierwsze - ! stopy NBP - zmieniają się w tym samym okresie i w tym samym
jak dane z nbp to już są oczyszczone bo one same w sobie są pewną statystyką i przybliżeniem (nawiasem mówiąc powinieneś podnieść ten problem w swojej pracy - jakości danych)
w takim przypadku może najlepszym badaniem będzie analiza trendów krótko, średnio i długookresowych
ja w swoich badaniach mam zupełnie inne typy danych i dlatego szedłem w kierunku klasteryzacji - tu się pewnie nie nada