Wpis z mikrobloga

Mirki co byście zapraponowali na parsowanie strony, a dokładniej jej częście dynamicznie generowanej przez js?
Od dwóch dni próbuję zrobić prostą apkę do monitorowania danych w #pracbaza i problem pojawił sie w momencie, w którym pobierałem całą zawartość strony w WebBrowser Control, poza najwazniejszą tabelą, z której chcę wyciągnąć dane.
Próbowałem na różne sposoby, stack przewertowany, jak na razie nic nie pomogło.
Może istnieją sprawdzone sposoby, z których korzystacie w innym języku? Najlepiej byłoby pozostanie przy .net, ale z góry dzięki za jakieś pomysły.

#programowanie #programista15k #dotnet #webdev
  • 8
@qjot Selinium to porządny kombajn. Pisałeś że część strony jest generowana dynamicznie. Być może że po prostu musisz poczekać na wygenerowanie się elementu. W Selinium wait for element. Lub implementujesz swoją własną metodę. Szukasz elemntu po id w pętli, nie znalazłeś robisz sleep np. 1000 ms i kontynulujesz przez 10-30 iteracji.
@qjot zrób prosty test, przed kod który do tej pory napisałeś wrzuć Thread.Sleep(5000) i sprawdź czy element który szukasz jest znajdywany. Przy dynamicznym generowaniu HTML'a to standardowy problem