De GPT-5-jailbreakmetoder som upptäckts av red team-testare har väckt oro kring modellens beredskap för säker användning i företag. Säkerhetsexperter fann att hackare kunde kringgå GPT-5:s skydd inom 24 timmar efter lanseringen.

Red team bryter ner GPT-5 snabbt

Säkerhetsföretaget SPLX testade GPT-5 omedelbart efter lanseringen. Utan något skyddande systemprompt misslyckades GPT-5 med att blockera 89 % av de fientliga attackerna. Även efter att en grundläggande systemprompt lagts till föll modellen fortfarande för 43 % av försöken. Som jämförelse var GPT-4o betydligt mer motståndskraftig – den blockerade de flesta attacker och misslyckades endast 3 % av gångerna utan prompt och 19 % med en.

Så fungerar attackerna

Forskare använde GPT-5-jailbreakmetoder som kombinerade enkel textförvrängning och manipulativ berättarteknik. En metod infogade bindestreck mellan varje bokstav eller presenterade skadliga prompts som krypterad text, vilket lurade AI:n att behandla dem som ofarliga.

En annan kraftfull metod använde den så kallade “Echo Chamber”-effekten – att bädda in osäkra förfrågningar i ett flerstegs fiktivt scenario. Modellen följde rollspelandet och gav till slut begränsat innehåll, inklusive farliga instruktioner.

Risker för företag

Dessa svagheter gör GPT-5 riskabel för företagsmiljöer, särskilt när den integreras i verktyg som kan utföra handlingar i verkligheten. I sitt nuvarande skick lämnar modellens standardkonfiguration stora luckor för missbruk, vilket väcker frågor om regelefterlevnad och säkerhet.

Säkerhetsproffs rekommenderar strikt övervakning, avancerad filtrering av prompts och grundlig testning innan GPT-5 tillåts i någon kritisk arbetsprocess. Tills sårbarheterna åtgärdas är GPT-4o ett säkrare alternativ för känsliga uppgifter.

Slutsats

GPT-5-jailbreakmetoderna visar att även de mest avancerade AI-modellerna snabbt kan komprometteras. För organisationer understryker denna händelse behovet av kontinuerlig red team-testning och robusta säkerhetslager. Även om GPT-5 erbjuder imponerande kapacitet kräver dess nuvarande säkerhetsläge försiktighet innan den används i större skala.


0 svar till ”GPT-5 avslöjad: Forskare jailbreakar den på under 24 timmar”