Deep learning with limited data: A synthetic approach
Publiceringsdatum: 2022-01-24
Rapportnummer: FOI-R--5215--SE
Sidor: 50
Skriven på: Engelska
Forskningsområde:
- Ledningsteknologi
Nyckelord:
- Artificiell intelligens
- maskininlärning
- djupinlärning
- djupa neuronnät
- syntetisk data
- simulering
- generativa modeller
- överföringsinlärning
Sammanfattning
Denna rapport fokuserar på hur syntetisk data, skapad genom simulering eller generativa modeller, kan användas för att adressera databrist inom djupinlärning. Dessa tekniker erbjuder många fördelar: 1) data kan skapas för fall som är svåra att observera i den verkliga världen, 2) data kan annoteras automatiskt och felfritt, och 3) data kan skapas utan risk för att vara integritetskränkande. Syntetisk data kan integreras i inlärningsprocessen med hjälp av tekniker som dataaugmentering eller genom att blanda syntetisk med verklig data innan träning. Den här rapporten utforskar främst överföringsinlärningstekniker i vilka kunskap som erhållits från att lösa ett problem kan överföras och återanvändas för att mer effektivt lösa ett annat relaterat problem. Förutom att introducera syntetiska datagenererings- och överföringsinlärningstekniker presenterar denna rapport experimentella resultat som ger insikter i hur effektiv syntetiskt skapad data kan vara i tillämpningar som kloning av stridspilotbeteende, detektion av militära fordon och ansiktsverifiering. Preliminära resultat från experimenten visar att militära simulatorer och generativa modeller kan användas för att stödja inlärning i dessa tillämpningar. Prestandan begränsas dock ofta av gapet i realism mellan syntetisk och verklig data.