Techgame.pl > Nauka > Sztuczna inteligencja uczy się od gier. Nie musi znać ich zasad, aby dobrze sobie radzić
Gabriela Sicińska
Gabriela Sicińska 19.03.2022 05:18

Sztuczna inteligencja uczy się od gier. Nie musi znać ich zasad, aby dobrze sobie radzić

Sztuczna inteligencja uczy się od gier. Nie musi znać ich zasad, aby dobrze sobie radzić
DeepMind/ https://deepmind.com/blog/article/alphazero-shedding-new-light-grand-games-chess-shogi-and-go
  • Sztuczna inteligencja DeepMind potrafi po mistrzowsku grać w szachy i Go

  • AI ma jednak problem z uczeniem się gier „od zera”

  • DeepMind stworzyło AI, które jest w stanie nauczyć się Pac-Mana

DeepMind to brytyjska firma działająca pod skrzydłami Google od 2014 roku. Zajmuje się projektowaniem i tworzeniem sztucznych inteligencji (AI), opierając się na rozbudowie metod uczenia maszynowego. W ten sposób firma stara się stworzyć algorytm, który, niczym człowiek, będzie w stanie uczyć się „w biegu”.

Sztuczna inteligencja uczy się grać w gry

Najgłośniejszą AI, która opanowała na poziomie mistrzowskim jakąkolwiek grę, jest stworzona właśnie przez DeepMind sztuczna inteligencja AlphaGo. Twórcy zaprogramowali w niej podstawowe zasady gry Go, po czym rozpoczęli uczenie jej różnych strategii, które może zastosować podczas rozgrywki.

AlphaGo zaczynała więc z poziomu amatora. Udało jej się jednakże dopracować umejętność gry w Go do perfekcji. Pozwoliło jej to wygrać z profesjonalnym graczem Go, uważanym za jednego z najlepszych zawodników na świecie - Lee Sedol. Ten historyczny moment w kwestii sztucznej inteligencji miał miejsce w 2016 roku.

Nauka nowej gry taka skomplikowana…

Od tamtego czasu firma DeepMind stworzyła dwie kolejne wersje AlphaGo, z których jedna mistrzowsko opanowała grę w szachy. Jednakże wszystkie algorytmy trafiały na przysłowiowe ściany w momencie, gdy miały się czegoś nauczyć „od zera”.

Mowa o grach, które dla człowieka wydają się banalnie proste. W końcu zdecydowanie łatwiej nam opanować podstawowe zasady Pac-Mana czy Mario niż nauczyć się grać w szachy na poziomie profesjonalnym. Lub nawet przyzwoitym. W przypadku sztucznej inteligencji jest dokładnie odwrotnie.

AI uczy się grać w Pac-Mana

Problem polega na tym, że poprzednie AI od DeepMind były w stanie szlifować umiejętności, które miały zaprogramowane przynajmniej w podstawowym stopniu. Nie były jednak w stanie zrozumieć zasad gier na podstawie obserwacji i metody „prób i błędów”. Krótko mówiąc, nie potrafiły nabywać nowych umiejętności bez „nauczyciela”.

DeepMind znalazło rozwiązanie tego problemu, tworząc nowy algorytm o nazwie MuZero. AI jest w stanie nauczyć się zasad gry metodą planowania. W jej ramach AI uczy się poprzez tworzenie dokładnego modelu środowiska, które ma opanować. Dotąd problemem tej metody była nadmierna złożoność tworzonych modeli.

Sztuczna inteligencja nadaje priorytety

MuZero zrewolucjonizowała metodę planowania w taki sposób, że potrafi wydzielić istotne elementy środowiska spośród wszystkich innych, i na ich podstawie stworzyć plan, który pozwoli jej zrozumieć, jak powinna rozwiązać problem, przed którym została postawiona.

Nowa AI firmy DeepMind zaprezentowała swoje umiejętności, skutecznie ucząc się gry w Pac-Mana. Twórcy byli pod wrażeniem, jak ich program skutecznie opanowuje zasady rozgrywki, mimo że gra nie pozwala na zaplanowanie zbyt wielu kroków w przód. Jest to ogromne osiągnięcie w tworzeniu prawdziwej sztucznej inteligencji.

Wybór Redakcji