Krigsspel med AlphaZero

Författare:

  • Mika Cohen
  • Farzad Kamrani
  • Fredrik Bissmarck
  • Peter Hammar

Publiceringsdatum: 2021-01-19

Rapportnummer: FOI-R--5057--SE

Sidor: 26

Skriven på: Svenska

Forskningsområde:

  • Ledningsteknologi

Nyckelord:

  • Artificiell intelligens
  • maskininlärning
  • förstärkt djupinlärning
  • AlphaZero
  • krigsspel
  • Risk

Sammanfattning

Optimeringsalgoritmer som spelar krigsspel har länge framstått som science fiction. Men så för fyra år sedan - till forskarvärldens häpnad - lyckades en ny optimeringsalgoritm, AlphaGo, bli världsmästare i Go, ett anrikt strategispel med särskild status inom krigsspelskretsar. Över en natt förändrades vad som kunde anses möjligt. AlphaGo utmynnade några år senare i AlphaZero, en generell optimeringsalgoritm som lär upp sig själv i strategispel till övermänsklig spelstyrka. AlphaZero har på kort tid hunnit förnya taktik och strategi inom en rad klassiska strategispel. Denna rapport introducerar AlphaZero och dess möjliga tillämpning inom krigsspel. Rapporten visar hur AlphaZero, som spelar abstrakta strategispel i forskningslitteraturen, även kan fås att spela ett enklare krigsspel - Risk. De preliminära resultaten pekar på att algoritmen behöver tillföras ett visst mått av enklare heuristik (domänkunskap) för att nå en nivå som motsvarar eller överträffar en mänsklig expert.