Wpis z mikrobloga

Skopiuj link

konto usunięte 12.06.2019, 19:00:06

#naukaprogramowania #python próbuję odpalić beautiful soup na gumtree.co.uk ale niestety pojawił się błąd. Czy spotkał się ktoś z podobną sytuacją ?

J.....L - #naukaprogramowania #python próbuję odpalić beautiful soup na gumtree.co.uk... — **źródło:** comment_TmFA7fOUkJYOBc47gLmbveNOLj4GlbUg.jpg

GaiusBaltar

12.06.2019, 19:09:08

@JungleJamPL: Pewnie serwer blokuje Cię po user agencie, gumtree raczej nie lubi botów, i łapiesz się na najbardziej domyślne zabezpieczenia.

J.....L

konto usunięte 12.06.2019, 19:10:37

@GaiusBaltar: może da się to ominąć ? skorzystać z innego parsera niż beautiful soup ?

Straher

12.06.2019, 19:10:50

bierze cie za robota ( ͡° ͜ʖ ͡°), uzywaj requests zamiast urllib

GaiusBaltar

12.06.2019, 19:15:55

@JungleJamPL: Tak, kilka rzeczy trzeba robić:
- ustawić wszystkie headery jak z jakiejś przeglądarki, np. firefoxie czy innym chromie skopiuj sobie wszystkie headery requesta
- nie wiem jak Twoja bibilioteka obsługuje cookies i sesje, ale trzeba dopilnować aby odbierała i wysyłała cookies
- dobrze unikać wysyłania serii requestów po kolei, lepiej dawać losowe interwały

To pozwoli obejść większość, ale nie wszystkie zabezpieczenia. Jeśli chcesz coś, czego serwer nie zablokuje, najlepiej jest

Ilythiiri

J.....L

konto usunięte 12.06.2019, 19:29:37

@GaiusBaltar: @Straher:

As you were browsing **www.gumtree.com** something about your browser made us think you were a bot. There are a few reasons this might happen:
 
* You're a power user moving through this website with super-human speed.
* You've disabled JavaScript in your web browser.
* A third-party browser plugin, such as Ghostery or NoScript, is preventing JavaScript from running. Additional information is available in this support article.

After

GaiusBaltar

12.06.2019, 19:38:27

@JungleJamPL: Nie wiem co chcesz zrobić, nie wiem czy to jest zgodne z ich regulaminem, ale tak czy siak, o ile nie masz dużego doświadczenia w te klocki, webscrapingu z pythona nie zrobisz. Odpal sobie firefoxa, zbadaj sobie selenium, albo nawet prościej, "od środka" jakieś rozszerzenie typu Greasemonkey, i wyhacz tam skrypt.

Próbując to w pythonie zrobić zajedziesz się, i nic nie wyjdzie. Chyba, że chodzi Ci o naukę pisania botów

sokytsinolop

12.06.2019, 20:22:52 via Wykop Mobilny (Android)

@JungleJamPL: wysyłaj wszystkie nagłówki która wysyła przeglądarka, jeśli używają jakiegoś dodatkowego zabezpieczenia jak cloudflare to niestety będzie trudniej ale widziałem na githubie narzędzia które pomogą w obejściu tego

GaiusBaltar

12.06.2019, 20:50:46

@sokytsinolop: Po odpowiedzi jaką widzę, obstawiam, że wymagają jakiegoś requesta wygenerowanego przez javascript osadzony na ich stronie przed puszczeniem ruchu dalej. Domyślam się, że bez jakiejś ekwilibrystyki to nie zabangla w pythone. Lepiej łopatologicznie z przeglądarki oskryptować.

J.....L

konto usunięte 12.06.2019, 21:10:34

@GaiusBaltar: prawdę powiedziawszy w ostateczności trzeba będzie sięgnąć po jakieś selenium, ale inny portal udało mi się dzisiaj też sparsować, więc może i z tym się uda taka 'automatyzacja'.

J.....L

konto usunięte 12.06.2019, 21:11:27

@sokytsinolop: będę działał, szukał rozwiązania, jak coś wymyślę to napiszę

Aktywne Wpisy

kidi1

kidi1 +1313

5 godz. i 32 min temu

Robimy nitkę normalnych Youtuberów, którzy kochają to co robią i robią to dobrze. Pokażmy patoli z tagu fammemma, że #youtube to nie tylko #boxdel #stu #wardega i reszta tych gwiazdek, które żyją z afer.
Ja zaczynam
Mietek Mietczyński

kidi1 - Robimy nitkę normalnych Youtuberów, którzy kochają to co robią i robią to dob... — **źródło:** temp_file1886849654286744944

WiesniakzPowolania

WiesniakzPowolania +402

3 godz. i 27 min temu

Co sie narobiło Mirki i Mirabelki
Do tej pory myślałem, ze będę miał bliźniaki. Doktor nas wezwał na powtórzenie badań prenatalnych bo coś mu sie nie podobało poprzednio i chciał powtórzyć.
Pojechaliśmy z duszą na ramieniu.
I wiecie co ?

Teraz przez najbliższe kilkanaście lat czeka mnie hałas, ciezka praca i bieda.
Ale nic to. Byle zdrowe były.
W sumie zawsze chciałem mieć dużą rodzinę 乁(♥ ʖ̯♥)

WiesniakzPowolania - Co sie narobiło Mirki i Mirabelki
Do tej pory myślałem, ze będę ... — **źródło:** troj

Aktywne Wpisy

Aktywne Znaleziska

Ukraińskie siły specjalne wylądowały na Krymie!

Wielka Brytania: Baza zdjęć paszportowych zasili systemy rozpoznawania twarzy

Jest taki dobrobyt że ubogim Polakom zagląda w oczy głód

Uwaga Firma Pana Damian Talar nip 7722409216 i nip 5252967081

Wielka Brytania: Elektryczne auto porwało właściciela. Nie dało się go zatrzymać

Popularne tagi