Semi-automatisk datadriven webbanalys: detektion av fabricerad media, trovärdighetsbedömning och cyberhotsbevakning

Författare:

  • Magnus Rosell
  • Sebastian Bay
  • Ulrika Wickenberg Bolin
  • Marianela Garcia Lozano
  • David Gustafsson
  • Fredrik Johansson
  • Andreas Horndahl
  • Maja Karasalo
  • Hanna Lilja
  • Lukas Lundmark
  • Johan Sabel
  • Harald Stiff
  • Erik Valldor

Publiceringsdatum: 2022-04-05

Rapportnummer: FOI-R--5262--SE

Sidor: 101

Skriven på: Svenska

Forskningsområde:

  • Ledningsteknologi

Nyckelord:

  • datadriven analys
  • underrättelseanalys
  • omvärldsanalys
  • påverkansoperation
  • sociala medier
  • webbanalys
  • textanalys
  • bildanalys
  • AI
  • generering
  • detektion
  • maskininlärning
  • neuronnät
  • språkteknologi

Sammanfattning

Underrättelseanalytiker, och befattningar med motsvarande uppgifter, kan potentiellt hitta väsentlig information i media så som text, bild, ljud och video från internet. Med semi-automatisk datadriven webbanalys avses användning av automatiska metoder för analys av webbdata för att stödja mänskliga analytiker. Utvecklingen av djupa neuronnät har resulterat i stora förbättringar av de flesta metoder för automatisk behandling av media, men har också som konsekvens att det numera går att automatiskt skapa, eller generera, till exempel ansiktsbilder och texter som människor inte kan särskilja från bilder av äkta ansikten och texter som skrivits av människor. I denna rapport undersöks några automatiska metoder som kan användas för att detektera genererad media. Information som identifierats manuellt eller automatiskt behöver bedömas med avseende på trovärdighet. Denna rapport innehåller undersökningar av några automatiska metoder för trovärdighetsbedömning. Flera av dem använder sig av djupa neuronnätsmetoder för textanalys. Utöver vetenskapliga undersökningar beskrivs i denna rapport även prototyper som utvecklats under flera år. De har använts för att verifiera metoder på realistisk data, samt för demonstrationer och försök i samarbete med analytiker. Ett av försöken handlar om att bevaka information om cyberhot i textdata.