Wpis z mikrobloga

Skopiuj link

18.04.2024, 12:07:37

Mam problem z AI. Może ktoś mi doradzi jak sobie z tym poradzić.

Tworzę sobie grę w której gracz musi odpowiadać na pytania podczas gry i te pytania zwiekszają mu statystyki, albo jedna albo drugą. Czasami wybór jednej obnizy statystyke drugiej itd. ŻADEN AI nie jest w stanie poprawnie odpowiedzieć. Każde się myli na najprostszej mozliwej kombinacji.

Podaje że są dwie statystyki L i D i żadna nie moge przekroczyć 6 ( w sensie powyzej 6 nie dodaje żadnych punktów, ale nadal powinien odjąć jeżeli wybór tego wymaga).

1. A=+1L i -1D, B=+1D i -1L
2. A=+2L i -1D, B=+1D
3. A=+1D, B=+1D i +1L
4. A=+1L, B=+1D
5. A=+2L i -1D, B=+2D i -1L
6. A=+1D i -1L, B=+1L i -1D

Prosze żeby wskazał mi najlepszy możliwy wybór żeby końcowo uzyskać najwyzszy wynik L i D, a chatgpt4 podaje mi:

Gracz powinien wybrać następujące odpowiedzi, aby osiągnąć najwyższe możliwe wartości dla L i D (zakładając, że żadna ze statystyk nie może przekroczyć 6):

Wybór 1: B (D=1, L=0)
......

i już w pierwszym robi błąd bo L wyniesie przy B -1.

Rozumiem że pytanie jest trudne i w ogóle no ale od tego chyba one są żeby odpowiadać na takie. Dodam że te wszystkie inne darmowe boty nie radziły sobie nawet z poprawnym wyliczeniem aktualnych wartości po 6 pytaniu jak mu podawałem co wybierał gracz. Czasem odejmowały, czasem nie odejmowały, czasem pisały że przepraszały za błąd i teraz już rozumieją że jak dodawały D to musza odjąć L po czym podawały mi znowu wynik z błędem.

AI jeszcze wymaga DUUUUUUŻO pracy.

#ai #programowanie #chatgpt #claude #copilot #gemini

kajakolak

18.04.2024, 12:25:54 via Wykop

@BC_anada: Ale dlaczego chcesz do tego używać LLM? XD

Asgraf

18.04.2024, 12:37:57 via Wykop

@BC_anada: duży model językowy jak sama nazwa mówi umie operować językiem a nie matematyką

kajakolak

18.04.2024, 13:09:02 via Wykop

@BC_anada: Szukaj tutaj https://en.m.wikipedia.org/wiki/Combinatorial_optimization

BC_anada

18.04.2024, 13:32:51 via Wykop

@kajakolak: a dlaczego nie, przeciez robi normalnie obliczenia :) to nie jest jakies skomplikowane zeby sie na takim latwym czyms wykrzaczal

Krolik

18.04.2024, 14:32:25 via Wykop

@Asgraf:

duży model językowy jak sama nazwa mówi umie operować językiem a nie matematyką

Istnieje hipoteza że to jest to samo. Tzn. że jak model będzie wystarczająco dobry w język, to matematyka zrobi się sama.

Jednak z tym operowaniem językiem u LLMów jest też mega słabo. To że potrafią sklecić zdania, które wyglądają poprawnie gramatycznie to jedno, ale nie są w stanie już napisać np. sensownego opowiadania albo rozprawki. Próbowałem czatem

kajakolak

18.04.2024, 14:47:11 via Wykop

@BC_anada: Niewiele rozumiesz

Raberr

18.04.2024, 16:20:44 via Wykop

@BC_anada: Popatrz sobie na te wątki niżej, problem jest inny ale też jest tam konieczność jakiejś ciągłości:

https://twitter.com/VictorTaelin/status/1777049193489572064

https://twitter.com/futuristfrog/status/1778109834509832462

tutaj jest zwycięski prompt: https://github.com/VictorTaelin/ab_challenge_eval/tree/main/users/futuristfrog

Może ci się poszczęści, ale i tak pewnie lepiej i prościej będzie to zrobić jakimś prostym sprawdzeniem przyszłych stanów.

Asgraf

19.04.2024, 08:17:13 via Wykop

@Krolik: Ludzie posiadają dwa tryby pracy mózgu:
1) myślenie szybkie (myślenie odruchowe, myślenie instynktowne, myślenie stereotypowe, pamięć mięśniowa, intuicja) - to myślenie jest szybkie, tanie energetyczne ale zawodne
2) myślenie wolne (oparte na dokładnej analizie wszystkich dostępnych opcji, oparte planowaniu działań i oparte na rzetelnym researchu) - to myślenie jest powolne, drogie energetycznie i męczące

Dzisiejsze LLMy implementują myślenie typu 1)
Myślenie typu 2) wymaga rozwiązań RAG typu tree of thought

BC_anada

20.04.2024, 10:51:17 via Wykop

@kajakolak: no patrz, czyli to co wrzucil kolega wyzej odnosnie tego konkursu to jednak da sie to zrobic. Chyba jednak niewiele jeszcze rozumiesz ( ͡° ͜ʖ ͡°)

kajakolak

24.04.2024, 09:13:53 via Wykop

@BC_anada: Przykra sprawa, nie lekceważę jej. Odniosę się do niej w poniedziałek o 15 w publicznym wpisie ( ͡° ͜ʖ ͡°)

Aktywne Wpisy

luke-dolla7

luke-dolla7 +131

2 godz. i 43 min temu

Pani redaktur my podpisali, ale my umowy nie czytali odcinek 2137
#nieruchomosci #kredythipoteczny #kredyt #heheszki

luke-dolla7 - Pani redaktur my podpisali, ale my umowy nie czytali odcinek 2137
#nier... — **źródło:** temp_file1818932681366771221
Pobierz

krucjan

krucjan +159

1 godz. i 54 min temu

W końcu wszystkie formalności dopięte i przesiadam się na nowe auto, c-elysee z 2014r 🥰
Dla mnie to jakbym z salonu wyjechał, całe życie jeździłem 20 letnimi gratami, które nawet w dniu produkcji uchodziły za gruzy. 10 letnia fura, która wygląda jak normalne, współczesne auto to jest dla mnie szok xD
Mam nadzieję, że posłuży z 5 lat.

#chwalesie #taxi #motoryzacja #szczecin

krucjan - W końcu wszystkie formalności dopięte i przesiadam się na nowe auto, c-elys... — **źródło:** temp_file9112710770260694639
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

29 razy na Mount Everest. Szerpa Kami Rita pobił własny rekord

Niemcy dużo obiecują Ukrainie ale mało robią? Rheinmetall pod ostrzałem

Żydzi blokują, niszczą i plądrują pomoc humanitarna dla Gazy

Rząd chce opodatkować tanie zakupy z AliExpress. Polacy wciąż kupują na potęge.

Lekarze z Ukrainy mają znać język polski. Będzie wymóg w ustawie

Popularne tagi