Wpis z mikrobloga

Cześć Mireczki,

poprawiłem cześć wpisów w pliku CSV, które wcześniej wyciągnąłem z tagu #bookmeter na temat "3 edycji"(dane od 3 marca 2015r.) o które prosiła @kizimajaro.
Są tam kolumny z id, data, nick, pasek, autor, tytuł, gatunek, ocena.

Jeśli autor wpisu nie wstawił minimum etykiet "Autor:" lub "Tytuł:"(lub podobnych np. "tytuł:", "autorzy:") to taki wpis nie pojawi się w pliku CSV.

W porównaniu do wersji v2 zostało uwzględnionych więcej wpisów oraz poprawione gatunki(chyba kilka) a także poprawione kilka ocen. Uzupełnione zostały też niektóre puste tytuły i braki autorów. Podziękowania należą się też mireczkowi @haussbrandt, który wskazał i uzupełnił też część danych w poprzedniej wersji.

Oprócz samego pliku CSV wrzucam też paczkę z plikami tekstowymi (zrodlatxt.zip) na których opierało się zaciąganie danych (pliki tekstowe powstały przez pobranie z API wykopu).

Dodatkowo do pliku undetected.txt wrzucam wszystkie wpisy, w których nie zostały wykryte etykiety "autor:" lub "tytuł:", przez co nie znalazły się w zestawieniu CSV.

wykop_bookmeter_v3_UTF8.csv (separator pól - przecinek):
https://drive.google.com/file/d/1JnQAYcF6SNItBTIi94hNth43Yca6Iy8-/view?usp=sharing

zrodla_txt.zip:
https://drive.google.com/file/d/1n0LUGhmF-mWwtMMTScWPD3DTbCtPQbM7/view?usp=sharing

undetected.txt - wpisy, w których nie zostały rozpoznane etykiety autor i tytuł:
https://drive.google.com/file/d/11s9wyVeRV_cANxntcwPOanEX_eZlUcjR/view?usp=sharing

#bookmeter
  • 2
  • Odpowiedz