Semi-automatisk datadriven webbanalys: detektion av fabricerad media, trovärdighetsbedömning och cyberhotsbevakning
Publiceringsdatum: 2022-04-05
Rapportnummer: FOI-R--5262--SE
Sidor: 101
Skriven på: Svenska
Forskningsområde:
- Ledningsteknologi
Nyckelord:
- datadriven analys
- underrättelseanalys
- omvärldsanalys
- påverkansoperation
- sociala medier
- webbanalys
- textanalys
- bildanalys
- AI
- generering
- detektion
- maskininlärning
- neuronnät
- språkteknologi
Sammanfattning
Underrättelseanalytiker, och befattningar med motsvarande uppgifter, kan potentiellt hitta väsentlig information i media så som text, bild, ljud och video från internet. Med semi-automatisk datadriven webbanalys avses användning av automatiska metoder för analys av webbdata för att stödja mänskliga analytiker. Utvecklingen av djupa neuronnät har resulterat i stora förbättringar av de flesta metoder för automatisk behandling av media, men har också som konsekvens att det numera går att automatiskt skapa, eller generera, till exempel ansiktsbilder och texter som människor inte kan särskilja från bilder av äkta ansikten och texter som skrivits av människor. I denna rapport undersöks några automatiska metoder som kan användas för att detektera genererad media. Information som identifierats manuellt eller automatiskt behöver bedömas med avseende på trovärdighet. Denna rapport innehåller undersökningar av några automatiska metoder för trovärdighetsbedömning. Flera av dem använder sig av djupa neuronnätsmetoder för textanalys. Utöver vetenskapliga undersökningar beskrivs i denna rapport även prototyper som utvecklats under flera år. De har använts för att verifiera metoder på realistisk data, samt för demonstrationer och försök i samarbete med analytiker. Ett av försöken handlar om att bevaka information om cyberhot i textdata.