Wpis z mikrobloga

Mirki, ja wiem, że dziś #primaaprilis, ale mam poważne #pytanie :)

▶▶ Co powiedzielibyście na stworzenie wyszukiwarki wpisów na mikroblogu? ◀◀

Ale takiej porządnej... szukającej po słowach kluczowych, tagach, datach, randze usera, płci usera, po tym, czy wpis ma fotki/filmy, po ilości plusów, po ilości komentarzy itp... takie all-in-one.

Ja wiem, że obecnie takiej wyszukiwarki nie ma, a realizacja zadania wydaje się niemożliwa (bo API na to nie pozwala...) ale czuję, że wiem jak to zrobić ()

Tak mi chodzi po głowie ten projekt od dość dawna...
Myślicie, że przyjęłoby się? jest na to zapotrzebowanie?

Myślę, że sam dam radę z programowaniem - pytanie tylko, czy będzie 'wzięcie'? ( ͡º ͜ʖ͡º)

#mirko #wykop #technologia #programowanie
imlmpe - Mirki, ja wiem, że dziś #primaaprilis, ale mam poważne #pytanie :)

▶▶ Co ...

źródło: comment_uaqLk3J2jKTLFu12AiTx4Yvt2cn3In9L.jpg

Pobierz
  • 41
  • Odpowiedz
  • 1
@imlmpe: już parsowalem całe Mirko kiedy pisałem bota na obserwowanie. 2 dni i byłem już w połowie wpisów. Później zrezygnowałem bo zaczynały się Nicki profili usunietych ( ͡° ʖ̯ ͡°)
  • Odpowiedz
  • 0
@canto: testowałeś to rozwiązanie, czy zgadujesz? Zbieram dane od 9 dni... 24h/dobę. Nie wiem jak chciałbyś to zrobić w jeden wieczór ( ͡° ʖ̯ ͡°)
  • Odpowiedz
@imlmpe: na małym droplecie 2cpu, 2gb ram przy 100 wątkach curla mogę pobrać 100k wpisów w 10 minut

Debug[1459540551|7|0]: cUrl Multi info read: 1 Net::Curl::Easy=HASH(0x1e6e0a0) No error http://www.wykop.pl/wpis/99990/ 404

Debug[1459540551|10|0]: Got http://www.wykop.pl/wpis/99990/ content type text/html; charset=UTF-8

Debug[1459540551|10|1]: super thread - LEN 0 data 0 NUM 99999 total size 331357917

Debug[1459540551|10|1]: url_len 31 compressed Data len 5899 total size 331369591

^C


real 9m12.028s

user 4m59.188s

sys 4m54.768s


500MB skompresowanych danych.

W 10
  • Odpowiedz