Wpis z mikrobloga

Skopiuj link

14.12.2022, 13:44:10

chce zescrapować stronę, na której jest dużo textboxów i comboxów, w których są już konkretne wartości. Niestety w kodzie w htmlu wartości z tych boxów nie ma. Czy da się to jakoś zescrapować BeautifulSoupem, czy on po prostu wyciąga tekst z kodu html? Np. żeby znalazł value dla danego id. Dołączam screena jak to wygląda np. na wykopie, gdzie domyślny wartość z textboxa jest w kodzie html, u mnie tego nie ma #python #webscraping #html

Oake - chce zescrapować stronę, na której jest dużo textboxów i comboxów, w których s... — **źródło:** comment_1671025447fewUSZkFBzylXkI4QQ66KK.jpg
Pobierz

fiddle

14.12.2022, 13:45:43

@Oake: Skąd bierzesz html?

Rst00

14.12.2022, 13:48:45

@Oake: ale mówisz konkretnie o wykopie czy dałeś tylko przykład? Generalnie w kodzie HTML jest ta wartość i można ją spokojnie JSem wyciągnąć więc wątpię żebyś miał problem w pythonie. Musisz napisać więcej info a najlepiej wkleić kod jaki masz z pythona. Na innych serwisach możesz mieć problem że np. jakiś JS się odpala i modyfikuje DOM przez co nie możesz pobrać wartości bo ich po prostu w kodzie nie ma

Oake

14.12.2022, 13:49:47

@fiddle: soup = bs4.bs(response.text, 'html.parser'), ale co to ma za znaczenie? robiąć inspecta w przeglądarce nie ma tam szukanych przeze mnie wartośći

Oake

14.12.2022, 13:55:53

@Rst00: nie nie chodzi mi o wykop, to inna stronka. Wykop podałem jako przykład jak oczekiwałem, że będzie: jest textbox, w nim wartość domyślna "Najnowsze na stronie główna", inspectuję to i ten element ma atrybut "value" równy "Najnowsze na stronie główna". Tymczasem na mojej stronie jest tak: jest textbox, w nim wartość np. napis "Zupa", ale kiedy inspectuję tego textboxa w przeglądarce to ten element nie ma czegoś takiego jak value

fiddle

14.12.2022, 14:02:59

bs4

@Oake: Imho przeglądarka embedded albo selenium i będzie git majonez.

Oake

14.12.2022, 14:28:27

@fiddle: ok, a jakoś masz moze jakis pomysł jak to zrobic z selenium? bo teraz spróbowałem tak:
element = driver.find_element(By.XPATH, 'xpath')
element.text
i zwróciło pustego stringa, nie znajduje tego tekstu. To dla textboxa, z kolei taka sama metoda dla comboboxa zwraca wszystkie możliwości tego comboboxa, zamiast tej która jest obecnie wybrana.

fiddle

14.12.2022, 14:40:55

@Oake: jak to nie jest mega tajne pokaż stronę to Ci powiem jaki atrybut musisz pobierać.

Oake

14.12.2022, 14:41:02

@fiddle: ok juz mam, .getAttribute('value') zadziałało

Oake

14.12.2022, 14:41:16

@fiddle: trochę tajne : )

fiddle

14.12.2022, 14:44:20

Komentarz usunięty przez autora

RolnikSamWdolinie

14.12.2022, 15:26:57 via Zakop

@Oake: nie wiem na ile umiesz front ale do scrapowania 10x lepszyn jest nodejs i cheerio. Używasz tego jak jQuery

wbutachorangutan

Aktywne Wpisy

serek_heterogenizowany

serek_heterogenizowany +42

4 godz. i 57 min temu

Byłem przekonany, że moja dziewczyna mnie zdradza i przez to dopuściłem się zdrady profilaktycznej ale okazało się, że ona mnie nie zdradzała tylko przez kilka dni szykowała mi niespodziankę na urodziny i m.in. załatwiła nam tygodniowy wypad na wakacje. Mam na to dowody, że żadnej zdrady nie było i teraz mam wyrzuty sumienia.

Powinienem się przyznać? To prawdopodobnie będzie oznaczać koniec naszego związku ale z drugiej strony ja ją zdradziłem tylko dlatego

Co zrobić?

Przyznaj się 39.6% (684)
Nie przyznawaj się 60.4% (1043)

prezeskuliziemskiej

prezeskuliziemskiej +197

2 godz. i 50 min temu

#zlodzieje #zabka #pomocy #krakow
Mam sprawę, kumpel Żabkarz wziął na dzień próbny do pracownika. Gość radził sobie całkiem spoko i miał rzekomo doświadczenie w pracy w Żabce. Wiec zostawił go na godzinę samego przy kasie. Niestety gość okazał się oszustem - ukradł karty przedpłacone, powysyłał sobie hajs, ukradł trochę towaru i tablet. W sumie około 5-7k. Sprawa zgłoszona na policję, ale jak to policja - raczej będzie ciężko. Oczywiście dane fałszywe ale

prezeskuliziemskiej - #zlodzieje #zabka #pomocy #krakow
Mam sprawę, kumpel Żabkarz wz... — **źródło:** Zdjęcie z biblioteki
Pobierz

Aktywne Wpisy

Co zrobić?

Aktywne Znaleziska

Serbia chce dywersyfikacji od Chorwacji i stawia na Rosję

Ciężarówka z płynnym gazem utknęła na przejeździe - pociąg zdążył wyhamować

2222 dolary. Złoto najdroższe w historii

Tragedia w Łodzi! Mężczyzna spłonął na przystanku. Zatrzymano podejrzanego

To efekt Stanowskiego? Prenumeratorzy GW robią jej właśnie „jesień średniowiecza

Popularne tagi