OpenAI:s öppna modeller utmanar branschens normer

OpenAI har skakat om AI‑världen genom att släppa två avancerade modeller som vem som helst kan köra lokalt. Företaget, som tidigare varit känt för sina slutna GPT‑modeller, erbjuder nu gpt-oss-20b och gpt-oss-120b som gratis nedladdningsbara modeller med avancerade resonemangsförmågor.

Den mindre modellen, gpt-oss-20b, kan köras på modern konsumenthårdvara. Den större versionen, gpt-oss-120b, kräver ett kraftfullt datacenter-GPU med 80 GB VRAM. Båda modellerna är byggda för att leverera hög prestanda i lokala miljöer – ett tydligt avsteg från OpenAI:s tidigare slutna strategi.

Tillbaka till det öppna landskapet

Detta är OpenAI:s första öppna modell sedan GPT‑2 släpptes 2019. Efter det höll företaget GPT‑3 och GPT‑4 bakom API‑väggar, medan konkurrenter som Meta, Mistral, DeepSeek och Qwen tog ledningen inom öppna modeller.

Att OpenAI nu plötsligt återvänder till det öppna ekosystemet signalerar en tydlig strategisk förändring. Företaget placerar sig nu sida vid sida med andra aktörer inom öppen AI‑utveckling.

Prestanda och kapacitet

OpenAI hävdar att de nya modellerna överträffar andra modeller i samma storlek när det gäller resonemangsbaserade tester. Modellerna stöder även verktygsanvändning, få-exempel-funktioner och kedjeresonemang. Resultaten ska enligt rapporter vara särskilt starka inom STEM‑ämnen, programmering och medicinska uppgifter.

Båda modellerna använder ett ”mixture-of-experts”-system, vilket minskar antalet aktiva parametrar per token. gpt-oss-20b aktiverar 3,6 miljarder parametrar per token, medan gpt-oss-120b aktiverar 5,1 miljarder. Denna struktur gör modellerna mer effektiva utan att tappa resonemangsförmåga.

Hårdvara och effektivitet

För att minska minnesbehovet använder modellerna MXFP4‑kvantisering, där varje parameter lagras med 4,25 bitar. Det minskar precisionen något, men ökar hastigheten och minskar modellens storlek.

Modellen gpt-oss-20b är 14 GB stor och kan köras i RAM på en kraftfull bärbar dator, även om ytterligare minne krävs för sammanhangsfönstret. gpt-oss-120b väger in på 65 GB och kräver hårdvara på företagsnivå.

Säkerhet och dataval

OpenAI betonade säkerhet i träningsfasen. Datamängden filtrerades för att exkludera skadligt innehåll, särskilt sådant relaterat till kemiska och radiologiska risker. Modellerna har tränats att avvisa farliga instruktioner och skydda mot prompt‑injektioner.

Träningen skedde huvudsakligen på engelska, med fokus på STEM, programmering och allmän kunskap.

Tillgänglighet för alla

Båda modellerna finns redan tillgängliga via plattformar som Ollama och AWS. OpenAI säger att syftet är att sätta kraftfull AI i händerna på fler användare. Strategin ska enligt företaget främja tillgång utan att kompromissa med säkerheten.

Slutsats

Lanseringen av OpenAI:s öppna modeller markerar ett avgörande skifte för både företaget och branschen. Genom att erbjuda högpresterande resonemangsverktyg gratis ställer sig OpenAI bakom den växande open source‑rörelsen. Dessa modeller kan förändra hur vi använder AI lokalt – och göra avancerad teknik tillgänglig för fler världen över.