Mireczki, mam pytanie.
Praktycznie nie jeżdżę pociągami i zupełnie nie orientuję się w temacie. Powiedzcie mi, czy planowe 20-25 minut na przesiadkę (dodam, że w #katowice i z pociągu #regio na #intercity) to powinno być wystarczająco czy za mało? Jak to się ma do opóźnień etc?
W przyszłym tygodniu czeka mnie ponad czterogodzinna podróż z małopolski do Warszawy i najbardziej odpowiadałoby mi właśnie połączenie z takim czasem na przesiadkę, tylko boję
Praktycznie nie jeżdżę pociągami i zupełnie nie orientuję się w temacie. Powiedzcie mi, czy planowe 20-25 minut na przesiadkę (dodam, że w #katowice i z pociągu #regio na #intercity) to powinno być wystarczająco czy za mało? Jak to się ma do opóźnień etc?
W przyszłym tygodniu czeka mnie ponad czterogodzinna podróż z małopolski do Warszawy i najbardziej odpowiadałoby mi właśnie połączenie z takim czasem na przesiadkę, tylko boję
- 1
@szprot_glazurnik: Polecam sprawdzić pociąg którym chcesz podróżować na www.czypociagsiespozni.pl Możliwe, że pociąg kursuje relatywnie punktualnie, wtedy 20-25 minut może wystarczyć. A może też tak być, że codziennie pociąg ma ponad godzinę opóźnienia lub więcej, wtedy nawet większy zapas czasu nie pomoże ( ͡° ͜ʖ ͡°)
- 2
@MrPickles: ubiegłeś mnie :)
- 221
Jakieś dwa lata temu chwaliłem się stworzeniem strony archiwizującej opóźnienia pociągów PKP i generującej proste prognozy opóźnienia na kolejny dzień.
Dziś chwalę się drugi raz, bo zaktualizowałem serwis do wersji 2.0 (na razie w wersji beta). Wersja ta zawiera dużo nowych funkcjonalności, całkowicie nowy UI oraz stworzony od podstaw model machine learning prognozujący opóźnienia pociągów na podstawie szeregu czynników, w tym opóźnień z poprzednich dni, różnych cech pociągu oraz danych pogodowych. Co
Dziś chwalę się drugi raz, bo zaktualizowałem serwis do wersji 2.0 (na razie w wersji beta). Wersja ta zawiera dużo nowych funkcjonalności, całkowicie nowy UI oraz stworzony od podstaw model machine learning prognozujący opóźnienia pociągów na podstawie szeregu czynników, w tym opóźnień z poprzednich dni, różnych cech pociągu oraz danych pogodowych. Co
- 1
@Urajah: Dzięki za opinię! Zobaczę co da się zrobić, bo do wyszukiwania korzystam z zewnętrznej biblioteki. Zobaczę, co mogę w niej zmienić, żeby działało to tak jak mówisz.
- 0
@ajgoron: Tak jak wspomniałem wyżej. Większość wszystkiego to Python, aplikacja Django, baza Postgres. Wszystko co związane z ML - AWS Sagemaker. Plus kilka usług do instrumentalizacji, analizy logów itp.
- 2
@FaterAnona: R2 to zły wskaźnik tutaj, gdyż jest to de facto model klasyfikacyjny, który ma wskazać jeden z czterech klas opóźnień. Jako, że klasy są niezbilansowane (ok. 82% pociągów w zbiorze treningowym było opóźnionych 0-4 minut), stosuję tzw. balanced accuracy score czy też balanced F1 score do porównywania jakości modeli.
- 0
@Yahto: O widzisz, to juz nie musisz go robić :D Tak na serio, jak miałeś jeszcze jakieś inne pomysły, albo niektóre kwestie chciałeś rozwiązać inaczej i chciałbyś się podzielić, to chętnie posłucham!
- 0
@KombajnemPrzezUkraine: nie wiem co dokładnie masz na myśli przez słowo skorelowane, ale model wykorzystuje dane pogodowe w tym m.in temperaturę powietrza, temperaturę punktu rosy, prędkość wiatru, opady deszczu i śniegu. Do predykcji brane są pod uwagę prognozy powyższych wartości na kolejny dzień kursu pociągu.
- 0
@JaszczompPolownik @hitherto: wyszukiwarka poprawiona, stacje powinny być teraz posortowane od największej na wszystkich przeglądarkach
- 0
- 0
@FaterAnona: Miałem do wyboru w sumie dwie opcje: zbilansowanie zbioru albo przekazanie informacji o niezbliansowaniu do algorytmu uczącego. Wybrałem tą drugą opcję. Zbilansowanie zbioru mogłem zrobić albo przez oversampling albo undersampling. Undersampling wiązał by się z dużą stratą informacji. Oversampling z kolei, obawiałem się, że może prowadzić do overfittingu oraz będzie wymagał większych zasobów obliczeniowych (a miałem już i tak stosunkowo duży zbiór danych).
- 1
@FaterAnona: Jeśli chodzi o same metryki to korzystałem z gotowej implementacji w scikit-learn (np. https://scikit-learn.org/stable/modules/generated/sklearn.metrics.balanced_accuracy_score.html). Natomiast to wykorzystywałem głównie do porównywania modeli. Jeśli chodzi o sam proces uczenia, to w RandomForestClassifier można dostarczyć m.in. parametr class_weight, który bezpośrednio przekazuje taką informację. W XGBoost jest to trochę trudniejsze bo taki parametr nie jest zaimplementowany, ale informację o wagach klas można przekazać bezpośrednio do każdej z instancji wchodzącej do zbioru treningowego (tutaj przykładowe
- 0
@optymistycznypesymista @Solitary_Man: chcielibyście sprawdzić w wolnym czasie czy cały czas macie ten freeze? Wdrożyłem poprawkę, która przynajmniej zadziałała na Brave na Redmi Note 9 Pro i mam cichą nadzieję, że zadziała też na Waszych urządzeniach
- 0
@optymistycznypesymista: ok, będę szukał dalej. Bo rozumiem, że chodzi o wyszukiwarkę na stronie głównej i freez się robi jak klikniesz np. kartę „według stacji przyjazdu”? Jeśli tak to czy freez jest na samym kliknięciu, czy dopiero jak zaczynasz coś pisać? Jeśli się nie przełączasz pomiędzy tymi opcjami i zostaje defaultowe „według trasy” to czy wszystko działa ok i można wyszukać pociąg?
- 0
@Solitary_Man: @optymistycznypesymista: Dzięki wielkie za info! Mam w takim razie materiał do pracy i postaram się rozwiązać ten problem. Pewnie to wina selecta, ale raczej co dokładnie ciężko powiedzieć. Dane do selecta są dodawane do wszystkich selectów już na starcie strony, więc zmiana zakładki nie powinna tutaj dużo zmienić. Sprawdzę i naprawię!
- 0
@DudziN123: W takiej sytuacji będzie trzeba poczekać kilka dni, aż pociąg „zbierze” potrzebne dane do prognozy. A w kolejnej wersji modelu nawet tyle nie będzie trzeba, bo opóźnienie będzie prognozowane też na podstawie opóźnień na danych odcinkach sieci kolejowej
- 0
@danniell: znam akurat tą historię, ale to trochę inny temat. Tamta aplikacja "konkurowała" z wyszukiwarką rozkładu jazdy, a moja propozycja to uzupełnienie systemu Infopasażer, ale w żaden sposób nie konkurencja. Tam gdzie wiem, że dane z Infopasażera mogą być bardziej właściwe, to informuję o tym użytkownika i podaję możliwie dokładny link do odpowiedniej stronie na Infopasażerze.
- 0
@cohontes: Finalnie zapisany biblioteką joblib. Cały pipeline mam utworzony w AWS Sagemaker i rozważałem utrzymanie punktu końcowego po stronie AWS, ale zdecydowały koszty i moje wymagania co do szybkości predykcji. Waga modelu to około 2-3 MB o ile dobrze pamiętam, a czas predykcji wraz z przygotowaniem niezbędnych danych wejściowych nie przekracza w 95% przypadków 200 ms.
- 0
https://www.czypociagsiespozni.pl
W porównaniu ze stroną powyżej, dostępna jest historia większej liczby pociągów (praktycznie wszystkich na sieci PKP) oraz znacznie łatwiej jest wyszukać pociąg, który nas interesuje.
W porównaniu ze stroną powyżej, dostępna jest historia większej liczby pociągów (praktycznie wszystkich na sieci PKP) oraz znacznie łatwiej jest wyszukać pociąg, który nas interesuje.
Cenię Prywatność
- Zainteresowania: motoryzacja, sport, ekonomia.
- Warszawa
Może macie jakiś hint gdzie najbezpieczniej parkować albo za darmo albo za niewielką cenę?
#berlin #niemcy