AI-injektionsangreb via nedskalerede billeder

august 26, 2025

Et nyt angreb fremhæver de voksende risici ved AI-promptinjektion. Forskere har fundet ud af, at ondsindede instruktioner kan skjules i billeder. Disse prompts forbliver usynlige, indtil billedet nedskaleres af et AI-system. Når de først afsløres, kan de udløse farlige handlinger, herunder datatyveri.

Sådan fungerer angrebet

AI-systemer nedskalerer ofte billeder, før de behandles. Angribere udnytter dette trin. De indlejrer instruktioner i højopløselige billeder. Når de nedskaleres, bliver subtile mønstre synlige for modellen. Disse mønstre fungerer som skjulte prompts, som AI’en tolker som kommandoer.

Trail of Bits demonstrerede, hvordan dette fungerer i praksis. De brugte angrebet mod Googles Gemini CLI. Når billedet blev nedskaleret, dukkede skjult tekst op og tvang modellen til at følge skadelige instruktioner. Dette omfattede forsøg på at stjæle følsomme data.

Hvorfor det er vigtigt

AI-promptinjektion er ikke et nyt problem, men denne variant er sværere at opdage. Den omgår traditionelle sikkerhedsforanstaltninger, fordi den ondsindede tekst ikke er synlig for menneskelige gennemseere. I stedet fremkommer den først, når systemet nedskalerer billedet.

Dette gør multimodale AI-systemer særligt sårbare. Disse platforme behandler både tekst og billeder og kan stole på visuelle data uden at indse, at de indeholder skjulte kommandoer. Dermed kan angribere omgå filtre og opnå uautoriseret adgang.

Forsvarstiltag

Organisationer kan tage flere skridt for at reducere risikoen:

Undgå automatisk nedskalering af billeder, hvor det er muligt.
Brug sikre algoritmer, der renser usædvanlige mønstre.
Inspicér billeder efter nedskalering for skjulte instruktioner.
Indfør streng input-filtrering for både tekst og billeder.
Udfør adversarial testing for at afdække svagheder, før angribere gør det.

Konklusion

AI-promptinjektion via nedskalerede billeder viser, hvor kreative angribere kan være. Skjulte prompts kan tvinge AI-modeller til at handle på skadelige måder, herunder at lække følsomme oplysninger. Ved at styrke billedbehandlingen og forbedre sikkerhedsforanstaltningerne kan udviklere begrænse eksponeringen for denne nye og sværere at opdage trussel.

Siyana Georgieva

AI Attack

AI-injektionsangreb via nedskalerede billeder

Sådan fungerer angrebet

Hvorfor det er vigtigt

Forsvarstiltag

Konklusion

0 svar til “AI-injektionsangreb via nedskalerede billeder”