Deep learning with limited data: A synthetic approach

Författare:

  • Linus Luotsinen
  • Farzad Kamrani
  • Lukas Lundmark
  • Johan Sabel
  • Harald Stiff
  • Viktor Sandström

Publiceringsdatum: 2022-01-24

Rapportnummer: FOI-R--5215--SE

Sidor: 50

Skriven på: Engelska

Forskningsområde:

  • Ledningsteknologi

Nyckelord:

  • Artificiell intelligens
  • maskininlärning
  • djupinlärning
  • djupa neuronnät
  • syntetisk data
  • simulering
  • generativa modeller
  • överföringsinlärning

Sammanfattning

Denna rapport fokuserar på hur syntetisk data, skapad genom simulering eller generativa modeller, kan användas för att adressera databrist inom djupinlärning. Dessa tekniker erbjuder många fördelar: 1) data kan skapas för fall som är svåra att observera i den verkliga världen, 2) data kan annoteras automatiskt och felfritt, och 3) data kan skapas utan risk för att vara integritetskränkande. Syntetisk data kan integreras i inlärningsprocessen med hjälp av tekniker som dataaugmentering eller genom att blanda syntetisk med verklig data innan träning. Den här rapporten utforskar främst överföringsinlärningstekniker i vilka kunskap som erhållits från att lösa ett problem kan överföras och återanvändas för att mer effektivt lösa ett annat relaterat problem. Förutom att introducera syntetiska datagenererings- och överföringsinlärningstekniker presenterar denna rapport experimentella resultat som ger insikter i hur effektiv syntetiskt skapad data kan vara i tillämpningar som kloning av stridspilotbeteende, detektion av militära fordon och ansiktsverifiering. Preliminära resultat från experimenten visar att militära simulatorer och generativa modeller kan användas för att stödja inlärning i dessa tillämpningar. Prestandan begränsas dock ofta av gapet i realism mellan syntetisk och verklig data.