@terion: Z tym angielskim to taka luźna uwaga, bez spiny. I tak liczy się merytoryka, wszyscyj sa przyzwyczajeni że to srodowisko jest miedzynarodowe i kazdy ma swoje jezykowe nalecialosci.
A mi sie merytorycznie podobalo, dowiedzialem sie paru nowych rzeczy.
  • Odpowiedz
@dupasmoka:
Tak, to prawda. Z drugiej strony w publikacji która linkuje autorzy udowadniają ze implementacja oparta o AVX2 ale bez użycia instrukcji popcnt może być szybsza niż sprzętowy popcnt.
  • Odpowiedz
@terion: GCC wspiera multi-version poza C++?

Przeglądając glibc można podejrzeć sobie implementację na piechotę w C dla niektórych funkcji z stdlib. Przykładowo, dobrze znany memset() zaimplementowany jest kilka sposobów. Kod wybierający właściwą wersję jest tutaj: https://sourceware.org/git/?p=glibc.git;a=blob;f=sysdeps/x86_64/multiarch/ifunc-memset.h;h=0c25eae4a48d5c9400a7fbd3d738448fe28f9603;hb=HEAD a poszczególne implementacje tutaj: https://sourceware.org/git/?p=glibc.git;a=tree;f=sysdeps/x86_64/multiarch;hb=HEAD pliki memset-*.S
  • Odpowiedz
@b33zon:
Hej. Nie chodzi o optymalizację.
Dodaj sobie przełącznik -std=c++11 albo -std=c++17 i ffsl() będzie wołane, a nie inlineowane.
Ale faktycznie jestem zaskoczony, że na domyślnych ustawieniach beż żadnych flag jest włączone -std=gnu++11

Generalnie wniosek z tego taki, że warto mieć włączone i -std=gnu++XX i używać builtin, bo z jednej strony są jakieś dodatkowe optymalizacje, a z drugiej strony dla builtin jest lepsza gwarancja, że będzie zawsze inline.
  • Odpowiedz