AI-injeksjonsangrep gjennom nedskalerte bilder

august 26, 2025

Et nytt angrep fremhever de økende risikoene ved AI-promptinjeksjon. Forskere har funnet ut at ondsinnede instruksjoner kan skjules inne i bilder. Disse promptene forblir usynlige til bildet blir nedskalert av et AI-system. Når de først avdekkes, kan de utløse farlige handlinger, inkludert datatyveri.

Slik fungerer angrepet

AI-systemer skalerer ofte ned bilder før de behandles. Angripere utnytter dette steget. De bygger inn instruksjoner i høyoppløste bilder. Når de nedskaleres, blir subtile mønstre synlige for modellen. Disse mønstrene fungerer som skjulte prompts som AI-en tolker som kommandoer.

Trail of Bits demonstrerte hvordan dette fungerer i praksis. De brukte angrepet mot Googles Gemini CLI. Når bildet ble nedskalert, dukket skjult tekst opp og tvang modellen til å følge skadelige instruksjoner. Dette inkluderte forsøk på å stjele sensitiv informasjon.

Hvorfor det er viktig

AI-promptinjeksjon er ikke et nytt problem, men denne varianten er vanskeligere å oppdage. Den omgår tradisjonelle sikkerhetsbarrierer fordi den ondsinnede teksten ikke er synlig for menneskelige granskere. I stedet blir den synlig først når systemet skalerer ned bildet.

Dette gjør multimodale AI-systemer spesielt sårbare. Disse plattformene behandler både tekst og bilder og kan stole på visuelle data uten å innse at de inneholder skjulte kommandoer. Dermed kan angripere omgå filtre og få uautorisert tilgang.

Forsvarstiltak

Organisasjoner kan ta flere grep for å redusere risikoen:

Unngå automatisk nedskalering av bilder der det er mulig.
Bruk sikre algoritmer som renser uvanlige mønstre.
Inspiser bilder etter nedskalering for skjulte instruksjoner.
Innfør streng input-filtrering for både tekst og bilder.
Utfør adversarial testing for å avdekke svakheter før angripere gjør det.

Konklusjon

AI-promptinjeksjon via nedskalerte bilder viser hvor kreative angripere kan være. Skjulte prompts kan tvinge AI-modeller til å utføre skadelige handlinger, inkludert lekkasje av sensitiv informasjon. Ved å styrke bildebehandlingen og forbedre sikkerhetstiltakene kan utviklere begrense eksponeringen for denne nye og vanskelig oppdagbare trusselen.

Siyana Georgieva

AI Attack

AI-injeksjonsangrep gjennom nedskalerte bilder

Slik fungerer angrepet

Hvorfor det er viktig

Forsvarstiltak

Konklusjon

0 responses to “AI-injeksjonsangrep gjennom nedskalerte bilder”