Novinky / Hry

Bližší pohled na DeepMind, Google AI, která ovládá StarCraft 2

31 2020 května Tato funkce byla původně vydána v lednu 2019.

Bylo by vám odpuštěno za předpokladu, že technologie umělé inteligence DeepMind se již osvědčila.

V roce 2016 slavná počítačová laboratoř sledovala, jak jeden z jejích programů umělé inteligence dělá něco nemyslitelného a vyhrál hru Go proti tehdejšímu světovému šampionovi - a lidské bytosti - Lee Sedolovi. Zvládnutí starověké čínské deskové hry bylo jen jedním z příkladů strojového učení, které DeepMind doufá, že jej nakonec může použít k revoluci v průmyslových odvětvích, jako je věda, zdravotnictví a energetika.

Pro další část této cesty se DeepMind zaměřil na StarCraft II. Sedm let stará RTS může být stále senzací esportu, ale není to zjevný krok od Go. Koneckonců-a omlouvám se Blizzardu-2500 let stará abstraktní strategická hra je považována za vrchol hry design, strategická hloubka a elegantní složitost. Ale věc Go - a toho dalšího skvělého partnera pro výcvik AI, Chess - je, že je přesně uspořádaná a pevně strukturovaná. Navzdory zastrašujícím kombinacím možných tahů, které tyto hry nabízejí, není jejich hloubka nutně doplněna měřítkem.

Multiplayerová RTS je na druhou stranu trochu chaotičtější. Nejlepší profesionální hráči StarCraft II mohou dosáhnout více než 800 smysluplných akcí myši a klávesnice za minutu. Je to dynamická a nevyzpytatelná strategická hra hraná rychlostí pekelného shmupu kulek, kde se v matoucí spleti rve nesčetné množství interakčních systémů. StarCraft II vyžaduje, aby se jeho hráči vypořádali s nejistotou a porozuměli jemným prostorovým prostředím. To vše je pro AI docela výzva.

Vignette YouTube

DeepMind jako takový vytvořil program AI s názvem AlphaStar s jediným životním cílem: zvládnout kompetitivní multiplayer StarCraft II. Ve skutečnosti je to už jedno s jedním z nejlepších hráčů na světě.

Proto se ocitám v ad hoc televizním studiu v sídle společnosti Google ve Velké Británii. Během posledních několika týdnů vyslala společnost DeepMind - která patří do mateřské abecedy společnosti Google - AlphaStar, aby bojovala s váženými profesionály týmu Liquid Dario 'TLO' Wünsch a Grzegorz 'MaNa' Komincz. Nyní je společnost připravena sdílet předem nahrané hry a komentátoři, kteří tyto hry nikdy předtím neviděli, byli najati, aby přinesli energii. Je nastavena velmi plynulá scéna.

Zdá se, že to, co se chystají odhalit, je důležité. Nejde jen o to, že AI čelí dvojici esportových spoluhráčů. AlphaStar zpochybňuje představu o dovednosti ve hře. Důsledky by mohly změnit způsob hraní profesionálních hráčů, vývoj budoucích titulů a samozřejmě také to, jak AI posiluje lidské schopnosti po celém světě.

DeepMind začal stavěním umělého hráče StarCraft II bez smyslu pro hru. Skutečně, první program StarCraft II - neboli „agentský“ AI program, který navrhli, nedokázal pochopit ani myš a klávesnici, natož pravidla nebo strategie. Ale stále se připojoval, sledoval půl milionu lidských her StarCraft a neustále se učil. AlphaStar napodobil, experimentoval, selhal a naučil se. Je to kombinovaný proces hlubokého učení a posilovacího učení v jádru nabídky DeepMind.

Na BlizzConu 2018 na začátku listopadu AlphaStar pochopil pravidla RTS a zvládl některé základní strategie založené na makrech. 10. prosince poté, co AI odehrála mnoho zápasů proti různým jejím verzím, porazila nejúspěšnějšího lidského hráče StarCraftu týmu DeepMind. Bylo na čase o úroveň výš.

O devět dní později odletěl manažer týmu Liquid TLO do Velké Británie. Jako profesionální hráč StarCraft II seřadil všechny různé rasy ve hře, ale je známý jako extrémně zkušený hráč Zergů. AlphaStar se však zaměřil na Protoss vs Protoss, aby jejich učení bylo konzistentní. Zápas proti Protosu pouze proti TLO by proto byl perfektní a sladký první test - vyhodit agenta DeepMind proti odborníkovi ze své komfortní zóny.

Auta bez řidiče: Zde je návod, jak Codemasters učí AI řídit

Jakmile se tok rozběhne, AlphaStar porazí TLO ve hře XNUMX pomocí tiše nekonvenčního herního stylu - odmítá rozdělit sytičovou rampu, což je dobře zavedený přístup vzhledem k vybrané mapě. Z brány se AI ujala vedení nad lidmi a nezdá se, že by se zajímala o tanec v rytmu konvence. Přes všechnu teorii, kterou hráči StarCraftu posedlí, AlphaStar už dělá věci jinak.

Vignette YouTube

Agent DeepMind by však měl být co nejlidštější. Existují omezení, jak rychle může interagovat, a ústupky, které zajistí jeho přístup, nejsou, pokud se abstraktní hry stanou nehratelnými. Ve skutečnosti TLO provedlo při svém prvním setkání více „akcí ​​za minutu“ než AlphaStar, což dokazuje, že není žádný důvod tvrdit, že převládá nefér rychlostní výhoda.

« J'ai commencé ce match avec beaucoup de confiance », raconte TLO à propos de sa défaite, arborant un sourire confus. Ensuite, le joueur de Team Liquid affirme qu'il a appris de l'expérience, et se sent prêt à battre AlphaStar dans les prochains jeux.

Věci jsou ale trochu jiné. Každé kolo AlphaStar mění strategii. AI je vždy neúprosná, vždy účinná - ale nikdy předvídatelná. TLO je poraženo 5: 0.

DeepMind se očividně nezdržoval. AlphaStar ve skutečnosti kombinuje pět různých agentů - něco jako šíření různých verzí sebe sama. Kromě toho DeepMind říká, že AlphaStar hraje zhruba 200 let her, což je fakt, že TLO si evidentně utěšovalo. Ale ve skutečnosti je to více jako lidské učení, než byste si mohli myslet.

Těchto 200 let zahrnuje vše každou verzi z AlphaStar se naučil hrát sám. Stejně tak hráč StarCraft II s 500 hodinami hraní za sebou také zdědí kolektivní učení hráčů, kteří před nimi přišli, a těch, s nimiž bojovali. Všichni jsme víc než naše vlastní zkušenost; o stovky let starší.

Ať tak či onak, byl čas na výzvu. MaNa je talentovaný a sebevědomý hráč zaměřený na Protoss. Jistě, teď by se AlphaStar setkal s jeho zápasem?

Po pěti přímých ztrátách v rukou AlphaStar se MaNa zdá být stejně rozčilená, vzrušená a fascinovaná. Stejně jako TLO byl očividně zaskočen. Přestože AlphaStar do puntíku dodržuje pravidla hry, jednoduše nebude dodržovat zavedené herní strategie, které hráči StarCraft II vyvinuli kolektivně.

Konverzace v reálném čase: le nejlepší RTS hry na PC

MaNa dostává přinejmenším spásnou milost pro sebe i pro veřejnost, pokud jde o esporty a možná i lidstvo obecně. DeepMind pořádá živou hru ve studiu, vysílá bradavice a všechno. A zdá se, že je to první hra proti profesionálovi, kde byla umělá inteligence DeepMind uzamčena, aby mohla používat kameru hráče. AlphaStar nevidí hru jako takovou, ale už dokázal porozumět celé oblasti zápasu, místo aby ji prožíval z pohledu kamery.

Tentokrát MaNa vítězí a očividně se jí extrémně ulevilo.

Když jsou kamery vypnuté, v dočasném studiu DeepMind je kolektivní pocit osvícení. AlphaStar možná prohráli svou poslední bitvu, ale konečné skóre 11-1 ve prospěch AI způsobilo, že se lidé třásli. A profesionální hráči se cítí optimističtí a přemýšliví.

TLO nám říká, že MaNa již využil taktiku, kterou viděl při nasazení AlphaStar, a použil ji ve hrách skutečného světa. Pokud AlphaStar dokáže i nadále nepředvídatelně měnit svůj herní styl, možná se lidé mohou naučit novým přístupům, stejně jako se AI učí pozorováním lidí. Můžeme vidět převratné nové herní teorie, které se objevují v konkurenčních esportech, které původně nebyly vytvořeny biologickými organismy.

Tým DeepMind mezitím nadšeně diskutuje o důsledcích vysoce kvalifikovaných hráčů AI na vývoj her. Mohou nakonec doufat, že jejich technologie zlepší globální dodavatelské řetězce, pomoc při katastrofách a práci zdravotníků, ale prozatím se hraje pojem umělé inteligence v lidském měřítku. Co by AlphaStar mohl znamenat pro testování her? Mohly by její schopnosti nejen posoudit návrhovou platnost dané hry, ale také podpořit tvůrčí proces? Mohla by AI uspět ve vytváření dokonale vyvážených her bez zásahu člověka?

Přestěhovat se: Cannon spěchá s nejlepšími strategickými hrami pro PC

TLO možná přemýšlí. Poukazuje však na to, že dokonale vyvážená hra nemusí být ze své podstaty dobrou hrou. Jsou to koneckonců drobné nedokonalosti rovnováhy, které hráčům StarCraft II umožnily vybudovat kolem sebe tak hustou knihovnu teorie her. Ze své milované RTS. Odtud pochází schopnost individuálního vkusu a dramatických zvratů osudu.

AI by nás už mohla zlepšit, ale to neznamená, že Perfection je ideální pro hraní her.