•  

    pokaż komentarz

    Warto zwrócić uwagę na ten komentarz:

    maelic
    It is a nice step different direction, perhaps the start if the revolution but Alpha Zero is not yet better than Stockfish and if you keep up with me I will explain why. Most of the people are very excited now and wishing for sensation so they don't really read the paper or think about what it says which leads to uninformed opinions.


    The testing conditions were terrible. 1min/move is not really suitable time for any engine testing but you could tolerate that. What is intolerable though is the hashtable size - with 64 cores Stockfish was given, you would expect around 32GB or more otherwise it fills up very quickly leading to markant reduce in strenght - 1GB was given and that far from ideal value! Also SF was now given any endgame tablebases which is current norm for any computer chess engine.

    The computational power behind each entity was very different - while SF was given 64 CPU threads (really a lot I've got to say), Alpha Zero was given 4 TPUs. TPU is a specialized chip for machine learning and neural network calculations. It's estimated power compared to classical CPU is as follows - 1TPU ~ 30xE5-2699v3 (18 cores machine) -> Aplha Zero had at it's back power of ~2000 Haswell cores. That is nowhere near fair match. And yet, eventhough the result was dominant, it was not where it would be if SF faced itself 2000cores vs 64 cores, It that case the win percentage would be much more heavily in favor of the more powerful hardware.

    From those observations we can make an conclusion - Alpha Zero is not so close in strenght to SF as Google would like us to believe. Incorrect match settings suggest either lack of knowledge about classical brute-force calculating engines and how they are properly used, or intention to create conditions where SF would be defeted.

    With all that said, It is still an amazing achievement and definitively fresh air in computer chess, most welcome these days. But for the new computer chess champion we will have to wait a little bit longer.

    •  

      pokaż komentarz

      @kolnay1: trochę takie szukanie dziury na siłę. Chodzi przede wszystkim o wydajność na wat pobieranej energii.

      Obawiam się, że StarFish przy 2000 rdzeni pobierałby kilka kilowatów energii (E5-2699v3 ma TDP 145W*30CPU + zasilanie dla całej reszty systemu).

      Co by nie mówić, DeepMind wypadł skuteczniej, 4TPU * 40W to 160W energii, SF (załóżmy dla 64 wątków) E5-2620 v4 * 2 (2* 16 rdzeni 32 wątki) z TDP 85W to już 170W. Czyli przy podobnej konsumpcji energii DeepMind wykorzystał ją lepiej i ograł SF.

    •  

      pokaż komentarz

      @kolnay1: tl;dr dla nie rozumiejących: To był tylko marketingowy stunt dla świetnych nagłówków, w praktyce jedna maszyna działa na kiepsko dostosowanych pozdespołach, a druga na specjalnie do tego dedykowanych, a i tak nie poszło jej jakoś doskonale.

    •  

      pokaż komentarz

      @FLAC: Nie szukanie dziury na siłę, tylko lekkie narzekanie na artykuły, które jak zwykle wyciągają trochę za dużo wniosków, żeby mieć chwytliwe nagłówki ("w ciągu 4 godzin zsyntezował i wyprzedził dostępną wiedzę szachową"), mimo że istnieje wiele bezdyskusyjnych powodów, by uważać, że to jednak jest pewien przełom. Poczekamy, to zobaczymy jak się spisze w TCEC i wtedy będziemy wiedzieć który silnik jest lepszy ( ͡° ͜ʖ ͡°)

    •  

      pokaż komentarz

      @kolnay1: tak, to prawda.

      Summa summarum, nic dziwnego że specjalny sprzęt (TPU) był wydajniejszy niż sprzęt ogólnego zastosowania (CPU), co widać choćby w grafice (GPU jest wydajniejsze w wyświetlaniu obrazu 3D niż CPU) czy nawet bitcoinie (ASIC znacznie szybsze od GPU). Ale pierwsze to mieć sprzęt, a drugie to potrafić go wykorzystać.

      Tutaj przeczuwam sieci neuronowe ze względu na swoją elastyczność, czy zdolność samooptymalizacji mogą wyprzedzić sztywne algorytmy uruchamiane na CPU.

    •  

      pokaż komentarz

      @FLAC: Tak. Moim zdaniem jedną z najciekawszych rzeczy w tym wszystkim jest to, że Alpha Zero po tych paru godzinach gry samemu ze sobą, zaczął faworyzować otwarcia, które w rzeczywistości też są faworyzowane. Poza tym bardzo ładnie grał, niby czasem tracił figury, ale grał pozycyjnie w taki sposób, że Stockfish nie umiał w żaden sposób wykorzystać tej pozornej przewagi.

    •  

      pokaż komentarz

      @kolnay1:
      Gdyby Stockfish miał analogiczne zasoby co Alphazero to stworzyłby tablicę transpozycji wielkości petabajta i powodzenia w graniu z nim.

      Poza tym kto sprawdzał, że Alphzero uczył się tylko 4 godziny i nie miał dostępu do historii partii szachowych. Ja jakoś w to nie wierzę. Równie dobrze farma serwerów mogła palić kilowaty przez ostatnie pół roku w celu "zmasakrowania" opensource'owego programu na hardware słabszym o rzędy wielkości.
      Poza tym mecz software'u powinno się robić sprawiedliwie na takim samych hardware.

      Ale wtedy nie byłoby merketingowego bullshitu od google tylko fakty, a tego korporacje nie lubią.

  •  

    pokaż komentarz

    (...) zsyntezował i wyprzedził dostępną wiedzę szachową (...)
    Co to znaczy? Bo brzmi jakby te zdanie skomponował ktoś kto nie miał zielonego pojęcia o czym pisze ( ͡° ʖ̯ ͡°)

    •  

      pokaż komentarz

      @Nicolai: tak brzmi, bo w oryginalnym tekście w taki poetycki sposób opisano uczenie się przez granie z samym sobą

    •  

      pokaż komentarz

      @Nicolai: Gdy program został uruchomiony nie miał żadnej wiedzy o szachach oprócz samych reguł. Przez cały proces nauki nie zostały mu pokazane żadne przykładowe rozgrywki ludzi. Przez zaledwie kilku godzin pracy (na trzeba dodać bardzo potężnych układach obliczeniowych od Google) podczas których program wiele razy grał przeciwko samemu sobie zdołał odkryć ponownie te same otwarcia i ruchy, które ludzkość dopracowywała przez setki lat, a następnie prześcignąć nawet najlepsze obecnie programy szachowe, które działają na podstawie ręcznego dobierania odpowiednich parametrów i przeszukiwania olbrzymiej przestrzeni dostępnych ruchów naprzód.

    •  

      pokaż komentarz

      @maver: Znaczy się domyślałem, że Alpha Zero rozgrywał partię za partią, na których klasyfikator uczył się o co chodzi w tej grze i jakie stosować taktyki, wszak na tym polega uczenie maszynowe. Przyczepiłem się konstrukcji zdania samego w sobie, bo tak zostało sformułowane, że nikt postronny nie zrozumiałby nic o tym co i jak zrobił DeepMind...

      (...) które działają na podstawie ręcznego dobierania odpowiednich parametrów i przeszukiwania olbrzymiej przestrzeni dostępnych ruchów naprzód.
      Znam dobrze algorytm alfa-beta. Sam nawet stworzyłem takowy ( ͡° ͜ʖ ͡°)

    •  

      pokaż komentarz

      stworzyłem

      @Nicolai: zaimplementowałem brzmi lepiej. Albo naklepałem. Stworzyć algorytm to trochę jak go wymyślić

  •  

    pokaż komentarz

    Podłączyć go pod centrum zarządzania bronią nukelarną ( ͡° ͜ʖ ͡°)

  •  

    pokaż komentarz

    Google Deep Mind AI Alpha Zero Devours Stockfish

    źródło: youtube.com

  •  

    pokaż komentarz

    Ciekawe czy kiedykolwiek uda się stworzyć komputer potrafiący rozegrać partię idealną, tzn. mogący przeanalizować wszystkie możliwe kombinacje. Ilość możliwych wariantów przy pierwszych 60 ruchach jest większa, niż liczba cząstek we wszechświecie.