Sztuczna inteligencja uczy się od gier. Nie musi znać ich zasad, aby dobrze sobie radzić
-
Sztuczna inteligencja DeepMind potrafi po mistrzowsku grać w szachy i Go
-
AI ma jednak problem z uczeniem się gier „od zera”
-
DeepMind stworzyło AI, które jest w stanie nauczyć się Pac-Mana
DeepMind to brytyjska firma działająca pod skrzydłami Google od 2014 roku. Zajmuje się projektowaniem i tworzeniem sztucznych inteligencji (AI), opierając się na rozbudowie metod uczenia maszynowego . W ten sposób firma stara się stworzyć algorytm, który, niczym człowiek, będzie w stanie uczyć się „w biegu”.
Sztuczna inteligencja uczy się grać w gry
Najgłośniejszą AI, która opanowała na poziomie mistrzowskim jakąkolwiek grę, jest stworzona właśnie przez DeepMind sztuczna inteligencja AlphaGo . Twórcy zaprogramowali w niej podstawowe zasady gry Go, po czym rozpoczęli uczenie jej różnych strategii, które może zastosować podczas rozgrywki.
AlphaGo zaczynała więc z poziomu amatora. Udało jej się jednakże dopracować umejętność gry w Go do perfekcji. Pozwoliło jej to wygrać z profesjonalnym graczem Go, uważanym za jednego z najlepszych zawodników na świecie - Lee Sedol. Ten historyczny moment w kwestii sztucznej inteligencji miał miejsce w 2016 roku.
Nauka nowej gry taka skomplikowana…
Od tamtego czasu firma DeepMind stworzyła dwie kolejne wersje AlphaGo, z których jedna mistrzowsko opanowała grę w szachy. Jednakże wszystkie algorytmy trafiały na przysłowiowe ściany w momencie, gdy miały się czegoś nauczyć „od zera”.
Mowa o grach, które dla człowieka wydają się banalnie proste. W końcu zdecydowanie łatwiej nam opanować podstawowe zasady Pac-Mana czy Mario niż nauczyć się grać w szachy na poziomie profesjonalnym. Lub nawet przyzwoitym. W przypadku sztucznej inteligencji jest dokładnie odwrotnie.
AI uczy się grać w Pac-Mana
Problem polega na tym, że poprzednie AI od DeepMind były w stanie szlifować umiejętności, które miały zaprogramowane przynajmniej w podstawowym stopniu. Nie były jednak w stanie zrozumieć zasad gier na podstawie obserwacji i metody „prób i błędów”. Krótko mówiąc, nie potrafiły nabywać nowych umiejętności bez „nauczyciela”.
DeepMind znalazło rozwiązanie tego problemu, tworząc nowy algorytm o nazwie MuZero . AI jest w stanie nauczyć się zasad gry metodą planowania . W jej ramach AI uczy się poprzez tworzenie dokładnego modelu środowiska, które ma opanować. Dotąd problemem tej metody była nadmierna złożoność tworzonych modeli.
Sztuczna inteligencja nadaje priorytety
MuZero zrewolucjonizowała metodę planowania w taki sposób, że potrafi wydzielić istotne elementy środowiska spośród wszystkich innych, i na ich podstawie stworzyć plan, który pozwoli jej zrozumieć, jak powinna rozwiązać problem, przed którym została postawiona.
Nowa AI firmy DeepMind zaprezentowała swoje umiejętności, skutecznie ucząc się gry w Pac-Mana . Twórcy byli pod wrażeniem, jak ich program skutecznie opanowuje zasady rozgrywki, mimo że gra nie pozwala na zaplanowanie zbyt wielu kroków w przód. Jest to ogromne osiągnięcie w tworzeniu prawdziwej sztucznej inteligencji.