Sztuczna inteligencja uczy się zabawy w chowanego
Ciekawa demonstracja jak samouczące się algorytmy w oparciu o proste zasady i fizykę z czasem uczą się coraz to inteligentniejszych zachowań i wykorzystania narzędzi.
R.....S z- #
- #
- #
- #
- #
- #
- 168
Ciekawa demonstracja jak samouczące się algorytmy w oparciu o proste zasady i fizykę z czasem uczą się coraz to inteligentniejszych zachowań i wykorzystania narzędzi.
R.....S z
Komentarze (168)
najlepsze
https://m.9gag.com/gag/ax7Dq9M/hide-and-seek-ai-learns-to-imprison-the-seekers-red-instead-of-hiding-during-the-first-10-seconds-of-setup-time
Komentarz usunięty przez moderatora
podejrzewam, ze sam tworca tego projektu sie tego nie spodziewal XD
Dodatkowo - AI będące hybrydą programowania i statystyki jest niezłe w rozwiązywaniu problemów statystycznych, nieoptymalnych (ciężko wyznaczyć jednoznacznie najlepsze rozwiązanie, nie mamy kompletu danych) natomiast nie ma
@br4k: Juniorzy po bootcampach się nie liczą ( ͡° ͜ʖ ͡°) Nie spotykam takich w pracy, a w firmie gdzie taki brano już się ich nie bierze. Nie wiem czemu, ale się domyślam (✌ ゚ ∀ ゚)☞
Natomiast nie jestem przekonany czy pracy
I to będzie bunt maszyn!!!
"Póki mamy TO, nic nam nie grozi ( ͡° ͜ʖ ͡°)"
I śmieszne i głupie jednocześnie, bo pytanie jest, skąd będziesz wiedział, kiedy wyłączyć wtyczkę we wszystkich komputerach na świecie w tym samym momencie?
No i to nie jest technicznie możliwe.
Komentarz usunięty przez moderatora
W zagadnieniach RL zwiększa się nagrodę lub zmniejsza karę.
Ktore (nagrody/kary) w (deep) RL są potem przekuwane w funkcje błędu - najczęsciej policy loss, value function loss i w niektorych wariantach inne. A potem suma tych funkcji błędów jest minimalizowana.
'entropy loss' chociażby nie jest związany z rewardem.
Gdyby nie było rewardów, to to nie byłby reinforcement learning.
@Jedenipol: Porównać optymalizacje do brute force to tak jakbyś porównał ewolucje do nieskończonej ilości małp. Różnica jest taka że mechanizm optymalizujący jest w stanie określić w którym kierunku powinien przemierzać przestrzeń rozwiązań a każda kolejna iteracja zaczyna tam gdzie poprzednia skończyła.
Te setki tysięcy prób
@Jedenipol: no nie do końca losowych bo metody sztucznej inteligencji mają tę cechę, że są adaptacyjne - minimalizują błąd.
Co do tych milionów operacji ostatnio ktoś mi mądrą rzecz na wykopie napisał odnośnie msi. Tak, robią te miliony operacji z malutką, kilkunasto neuronową siecią, ale z drugiej strony ludzki mózg ma >miliony neuronów, ale
Komentarz usunięty przez moderatora