Sztuczna inteligencja po 5,5 mld prób osiągnęła poziom eksperta w grze Stratego

Aplikacja „DeepNash”, stworzona przez zespół naukowców z DeepMind Technologies Ltd., jest w stanie grać w popularną grę Stratego na poziomie eksperckim. Wcześniejsze badania wykazały, że złożoność gry jest większa, niż w przypadku szachów lub go, z 10 535 możliwymi scenariuszami. Ten poziom sprawia, że stworzenie systemów sztucznej inteligencji zdolnych do gry w Stratego jest niezwykle trudne.
.Stratego to gra planszowa dla dwóch graczy, uważana za trudną do opanowania. Jak podaje portal Tech Xplore, celem każdego gracza jest przechwycenie flagi przeciwnika, która jest ukryta wśród 40 początkowych elementów gry. Każdy element gry jest oznaczony rankingiem siły — gracze o wyższej randze pokonują graczy o niższej randze w pojedynkach. Utrudnianie gry polega na tym, że żaden z graczy nie widzi oznaczeń na pionkach przeciwnika, dopóki nie spotkają się twarzą w twarz.
Wcześniejsze badania wykazały, że złożoność gry jest większa niż w przypadku szachów lub go, z 10 535 możliwymi scenariuszami gry. Ten poziom złożoności sprawia, że stworzenie systemów sztucznej inteligencji zdolnych do gry w Stratego jest niezwykle trudne. W tym nowym przedsięwzięciu naukowcy przyjęli inne podejście, tworząc aplikację zdolną do pokonania większości ludzkich i innych systemów sztucznej inteligencji.
Podobnie jak w przypadku innych projektów systemów sztucznej inteligencji, nowa aplikacja DeepNash najpierw nauczyła się grać w Stratego, grając sobą wiele razy — w tym przypadku 5,5 miliarda — co odpowiada setkom lat gry dla człowieka. Po tym, jak aplikacja nauczyła się grać, naukowcy nie kazali jej uczyć się strategii od mistrzowskich ludzkich graczy, ani nawet ogólnie grać przeciwko innym przeciwnikom. Zamiast tego opracowali algorytm, który działał w kierunku optymalnej strategii dla każdego ruchu, a nie perfekcji. Algorytm opierał się na teorii gier : optymalna strategia dawałaby DeepNash przynajmniej 50/50 szans na sukces w każdym danym ruchu — znacznie więcej, niż mogliby osiągnąć ludzie.
.Testy wykazały, że zespół znalazł sposób na zwiększenie szans aplikacji AI grającej w Stratego — osiągnął 84 proc. rekord wygranej, podczas 50 gier na platformie gier online i dzięki temu stał się jednym z trzech najlepszych graczy. Przeciwnikom, którzy grali z aplikacją, nigdy nie powiedziano, że grają przeciwko komputerowi.
Oprac. MJ.