OpenAI har rystet AI-landskabet ved at lancere to avancerede modeller, som alle kan køre lokalt. Virksomheden, der er kendt for sine proprietære GPT-modeller, tilbyder nu gpt-oss-20b og gpt-oss-120b som gratis, downloadbare modeller med stærke evner inden for ræsonnering.

Den mindre model, gpt-oss-20b, kan køre på almindeligt forbrugergrej. Den større model, gpt-oss-120b, kræver et kraftigt datacenter-GPU med 80 GB VRAM. Begge modeller er udviklet til høj ydeevne i lokale miljøer og markerer et klart skifte fra OpenAIs tidligere lukkede tilgang.

Tilbage i det åbne felt

Dette er OpenAIs første åbne model siden GPT-2, der blev udgivet i 2019. Siden da har modeller som GPT-3 og GPT-4 været låst bag API’er. Imens har aktører som Meta, Mistral, DeepSeek og Qwen taget føringen i open-weight-miljøet.

OpenAIs pludselige genindtræden i det åbne landskab viser en strategisk kursændring. Virksomheden stiller sig nu på linje med andre store aktører i open source-bevægelsen.

Ydeevne og funktioner

Ifølge OpenAI overgår de nye modeller andre åbne modeller i samme størrelsesklasse, når det gælder præstation i ræsonneringsopgaver. De understøtter også værktøjsbrug, få-eksempel-funktioner og kædebaseret ræsonnering. Rapporterne fremhæver stærke resultater inden for STEM, programmering og medicinske opgaver.

Begge modeller benytter en “mixture-of-experts”-arkitektur, som reducerer antallet af aktive parametre pr. token. gpt-oss-20b aktiverer 3,6 milliarder parametre, mens gpt-oss-120b aktiverer 5,1 milliarder. Dette forbedrer effektiviteten uden at svække modellernes ræsonneringsevner.

Hardware og effektivitet

For at mindske hukommelseskravene har OpenAI anvendt MXFP4-kvantisering. Her gemmes hver parameter med 4,25 bits, hvilket giver lavere præcision, men hurtigere behandling og mindre modelstørrelse.

gpt-oss-20b fylder 14 GB og kan køres i RAM på en bærbar computer, dog kræves mere hukommelse til kontekstvinduet. gpt-oss-120b er på 65 GB og kræver virksomhedsniveau-hardware.

Sikkerhed og datagrundlag

OpenAI har lagt vægt på sikkerhed under træningen. Datagrundlaget er renset for skadeligt indhold, især materiale relateret til kemiske og radiologiske risici. Modellerne er trænet til at afvise usikre forespørgsler og beskytte mod prompt injection-angreb.

Træningsdataene er overvejende engelsksprogede og fokuserer på STEM, programmering og almen viden.

Tilgængelighed og distribution

Modellerne er allerede tilgængelige via platforme som Ollama og AWS. OpenAI ønsker at gøre kraftfulde AI-værktøjer let tilgængelige for brugere over hele verden. Initiativet afspejler virksomhedens mål om at fremme adgang uden at gå på kompromis med sikkerheden.

Konklusion

Udgivelsen af OpenAIs åbne modeller markerer et vendepunkt for både virksomheden og hele branchen. Ved at tilbyde gratis og avancerede modeller til lokalt brug slutter OpenAI sig til den voksende open source-bevægelse. Disse modeller kan ændre måden, vi bruger AI på – og gøre stærke værktøjer tilgængelige for alle.


0 svar til “OpenAIs åbne modeller udfordrer branchens normer”