Gabriela Sicińska 19.03.2022 05:18

Sztuczna inteligencja uczy się od gier. Nie musi znać ich zasad, aby dobrze sobie radzić

DeepMind/ https://deepmind.com/blog/article/alphazero-shedding-new-light-grand-games-chess-shogi-and-go

Sztuczna inteligencja DeepMind potrafi po mistrzowsku grać w szachy i Go
AI ma jednak problem z uczeniem się gier „od zera”
DeepMind stworzyło AI, które jest w stanie nauczyć się Pac-Mana

DeepMind to brytyjska firma działająca pod skrzydłami Google od 2014 roku. Zajmuje się projektowaniem i tworzeniem sztucznych inteligencji (AI), opierając się na rozbudowie metod uczenia maszynowego. W ten sposób firma stara się stworzyć algorytm, który, niczym człowiek, będzie w stanie uczyć się „w biegu”.

Sztuczna inteligencja uczy się grać w gry

Najgłośniejszą AI, która opanowała na poziomie mistrzowskim jakąkolwiek grę, jest stworzona właśnie przez DeepMind sztuczna inteligencja AlphaGo. Twórcy zaprogramowali w niej podstawowe zasady gry Go, po czym rozpoczęli uczenie jej różnych strategii, które może zastosować podczas rozgrywki.

AlphaGo zaczynała więc z poziomu amatora. Udało jej się jednakże dopracować umejętność gry w Go do perfekcji. Pozwoliło jej to wygrać z profesjonalnym graczem Go, uważanym za jednego z najlepszych zawodników na świecie - Lee Sedol. Ten historyczny moment w kwestii sztucznej inteligencji miał miejsce w 2016 roku.

Nauka nowej gry taka skomplikowana…

Od tamtego czasu firma DeepMind stworzyła dwie kolejne wersje AlphaGo, z których jedna mistrzowsko opanowała grę w szachy. Jednakże wszystkie algorytmy trafiały na przysłowiowe ściany w momencie, gdy miały się czegoś nauczyć „od zera”.

Mowa o grach, które dla człowieka wydają się banalnie proste. W końcu zdecydowanie łatwiej nam opanować podstawowe zasady Pac-Mana czy Mario niż nauczyć się grać w szachy na poziomie profesjonalnym. Lub nawet przyzwoitym. W przypadku sztucznej inteligencji jest dokładnie odwrotnie.

AI uczy się grać w Pac-Mana

Problem polega na tym, że poprzednie AI od DeepMind były w stanie szlifować umiejętności, które miały zaprogramowane przynajmniej w podstawowym stopniu. Nie były jednak w stanie zrozumieć zasad gier na podstawie obserwacji i metody „prób i błędów”. Krótko mówiąc, nie potrafiły nabywać nowych umiejętności bez „nauczyciela”.

DeepMind znalazło rozwiązanie tego problemu, tworząc nowy algorytm o nazwie MuZero. AI jest w stanie nauczyć się zasad gry metodą planowania. W jej ramach AI uczy się poprzez tworzenie dokładnego modelu środowiska, które ma opanować. Dotąd problemem tej metody była nadmierna złożoność tworzonych modeli.

Sztuczna inteligencja nadaje priorytety

MuZero zrewolucjonizowała metodę planowania w taki sposób, że potrafi wydzielić istotne elementy środowiska spośród wszystkich innych, i na ich podstawie stworzyć plan, który pozwoli jej zrozumieć, jak powinna rozwiązać problem, przed którym została postawiona.

Nowa AI firmy DeepMind zaprezentowała swoje umiejętności, skutecznie ucząc się gry w Pac-Mana. Twórcy byli pod wrażeniem, jak ich program skutecznie opanowuje zasady rozgrywki, mimo że gra nie pozwala na zaplanowanie zbyt wielu kroków w przód. Jest to ogromne osiągnięcie w tworzeniu prawdziwej sztucznej inteligencji.

Tagi: Nowinka technologiczna AI