Jak prawo Benforda działa na wykopie i jak je udowodnić?

qluch
qluch

Prawo Benforda osiągnęło w ciągu tygodnia taką sławę o której sam odkrywca tego prawa by nie pomyślał. Jak to bywa z takim sukcesem, wielu ludzi rozumie go niewłaściwie i to miało miejsce dzisiaj gdy Mireczek @BArtus zawezwał mnie aby poinformować, że strona główna nie działa zgodnie z prawem Benforda. Taki spoiler alert (nie jest to żadne odkrycie, w zasadzie, nasz Mireczek udowodnił, że to prawo działa lecz sam o tym nie wiedział ( ͡° ͜ʖ ͡°) ).


W dziedzinie nauki, przyjmujemy zasadę, że jeśli mam jakieś prawo i wychodzi mi, że ono nie działa to pierwszym krokiem jest pytanie czy ja czegoś nie rozumiem lub czy moje założenia były prawidłowe. Stąd widząc, że swój LAKONICZNY wpis Mireczek podsumował tak:


Jak wydać powyżej pierwsza strona główna nie spełnia założeń Prawa Benford'a ¯\_(ツ)_/¯


Sami rozumiecie, że coś mi tu nie pasowało. Po pierwsze brakuje jakiegokolwiek wyjaśnienia co się tam wydarzyło. Pisząc opracowanie, należy wyjaśnić co zostało zrobione i jak, a tam mamy jakiś przykład kilku linijek kodu rodem programistów z KUL (#pdk) ( ͡° ʖ̯ ͡°) i cześć, pora na CS'a.


Postanowiłem zrobić własne opracowanie, oczywiście nie mam zgranego wykopu na dyskietce więc posłużyłem się próbką 100 znalezisk na stronie głównej. Dla tych znalezisk, spisałem liczbę wykopów i zakopów. Od początku nie pasował mi tutaj ich brak. Gdy opracowałem dane, w postaci histogramów okazało się, że dla tych 100 znalezisk, wynik jest bardzo podobny tak jak dla 2416085 znalezisk(?) (sic!) na "dyskietce" naszego Mireczka. (Gwiazdki są z wpisu, przyjmuję, że to częstość w jakiejś skali ale mogę się mylić).


595831795967774142524d78_1605011575jvx2ENGfYV7NOCJ338TXZl.jpg

Ok, postanowiłem sprawdzić zatem jak wygląda sprawa przy uwzględnieniu wszystkich głosów (wykopy+ zakopy) i po odjęciu zakopujących (wykopy-zakopy), oto wyniki:


595831795967774142524d78_16050119804BnZCTco4Sfh83IyQA5X2I.jpg

I jak widać, prawo Benforda nie działa (wystarczyło opracować 100 znalezisk) ale czy to oznacza, że właśnie udowodniłem, że to prawo to jest bujda na resorach? ( ͡° ͜ʖ ͡°) Jak już mówiłem, nauka polega na poszukiwaniu prawdy a nie na formułowaniu dowodów do przyjętej tezy (jak na przykład płaskoziemcy). Co w takim razie może nie działać? Co robię źle? Spójrzmy na to jak się ma prawo Benforda dla samych zakopów, może to coś nam powie? 

595831795967774142524d78_1605012325PCxnLWzOu91wG5WqreGeGU.jpg

O proszę, a tutaj działa. Hmmmm... czyli to nie jest tak, że prawo Benforda nie działa, tylko nie działa dla mojej próbki (co w sumie nasz Mireczek z dyskietką wykopu słusznie zauważył), więc jako naukowiec trzeba się zapytać dlaczego nie działa?

Co powie nam najpowszechniejsze źródło informacji czyli wikipedia?


Rozkłady wielkości, które obejmują tylko jeden rząd wielkości zwykle nie spełniają prawa Benforda.

Ha! No proszę, i jeszcze poniżej macie obrazek który w kapitalny sposób przedstawia nam to co widzieliśmy na trzech pierwszych rysunkach.


1605009413MYNP4Jcp1RJuRHAl3IQ2Ic31KCt4l.jpg


Czyli wychodzi na to, że prawo Benforda ma postać logarytmiczną! Naturalnie, jeśli wybierzemy próbkę która zawiera jeden rząd wielkości (częstość występowania znalezisk powyżej 1000 jest mała na stronie głównej) to nic dziwnego, że otrzymamy taki wynik.

Poniżej zamieszczam równanie na prawdopodobieństwo wystąpienia liczby k:


595831795967774142524d78_1605012982Zvn1sZW6zxFwQpjKEVD7sT.jpg

Stąd już szybko obliczymy sobie rozkład: 1 - 30,1% / 2 - 17,6% / 3 - 12,5% / 4 - 9,7% / 5 - 7,9% / 6 - 6,7% / 7 - 5,8% / 8 - 5,1% / 9 - 4,6%

Sprawdźmy jak powyższy rozkład ma się do zakopów (które zawierały kilka rzędów wielkości):

595831795967774142524d78_16050136071YVtw5prbn7UUSvI5SJwAC.jpg

Fajnie to wygląda, nie? Dla większej liczby znalezisk otrzymalibyśmy pewnie bardziej dokładne odwzorowanie. Ok, no to zróbmy teraz eksperyment. 

Skoro prawo Benforda działa dla zakopów, to dlaczego miałoby nie działać dla wykopów? Czego w takim razie nie pokazuje nam strona główna? W sumie całej reszty czyli przepastnego wykopaliska. Poniżej, aby pokazać wam przybliżoną skalę tego co jest nie wykopane zamieszczam wykres z danymi dla wszystkich wykopanych 3-cyfrowych znalezisk (275292 znalezisk):

595831795967774142524d78_16050154959X6NetTbN6E38DlzXJf0XX.jpg

To tyle, na teraz. A co do powyższego rozkładu, to pamiętajcie o wykopach które nie weszły na główną pomimo, że miały ponad 100 głosów, ze względu na zakopy.

Mógłbym teraz napisać, że nauka jest prawacka ale prawda jest taka, że nauka jest ani prawacka ani lewacka, jeśli ktokolwiek wam pisze, że nauka ma konotacje ideowe, to zapewne nie ma pojęcia o nauce i tyko się ośmiesza. Tą puentą dziękuję za uwagę i do następnego wykopaliska.