Lokala modeller bara nio månader efter GPT5

AI-modeller som går att köra lokalt på konsumenthårdvara för ca 25 000 kr ligger bara nio månader efter de allra senaste toppmodellerna, mätt på GPQA-Diamond*. Det är anmärkningsvärt kort "lagg" från betalvägg med data i USA till lokal konsumenthårdvara (Källa: Epoch AI, https://lnkd.in/duwXPzE3).

Det här gäller lokal inferens (träningen sker fortsatt centralt på superdatorer/moln), men det räcker långt för en hel del tillämpningar där latens och datakontroll spelar roll.

Om vi tar dagens ‘frontlinje’ som exempel betyder det att vi till våren 2026 har lokalt körbara modeller med förmågor motsvarande Grok 4 (lanserad 9 juli 2025) och GPT-5 (presenterad 7 augusti 2025).

Det matchar min egen upplevelse i vår lokala miljö där vi testat modeller som gpt-oss, deepseek-r1, gemma3, qwen3 med flera. I många fall ger de tillräckligt bra kvalitet när de är kvantiserade och körs på en högpresterande konsument-GPU. Trivselfaktorn i att kunna iterera utan API-token/credits är påtaglig.

Varför är avståndet inte större? Dels blir hårdvara hela tiden bättre men framför allt är det tekniker som modell-distillation (lärare → elev) och kvantisering som gör mindre modeller snabbare och mer minnes-effektiva med högst begränsad kvalitetsförlust (i rätt use-case).

Något jag saknar i Epoch AI:s rapport är varför trendlinjerna närmar sig varandra och försprånget ser ut att krympa.

Någon som har en teori? Eller som är intresserad av en diskussion kring vilka modellalternativ som är bäst för era behov? Bara att höra av sig.

(*): Lite mer tekniskt: siffrorna bygger på GPQA‑Diamond och på antaganden som 4‑bitars kvantisering, 8k kontext och att modellen ryms helt i VRAM. Att mäta hur bra AI‑modeller är är i sig svårt; GPQA‑Diamond fångar inte alla aspekter av verklig användning. Mindre, optimerade modeller kan ibland specialisera sig på enskilda benchmark och se välpresterande ut, men prestera sämre i bredare och mer oförutsedda arbetsflöden. Ta därför 9‑månader som en tumregel och inte som en garanti.

If you are looking for another cog in the machinery...

There are plenty of other consulting firms that offer those. But if you value key people with stellar AI and development skills that will make a difference for your development team and your business. Then, leave it in our care!

DROP US AN EMAIL

Contact OMATEQ

Custom software development

Erik Hallqvist

erik.hallqvist@omateq.com

+46 72 233 92 91

Tech & product management

Alexander Nelson Stavefeldt

alexander.nelson@omateq.com

+46 76 854 85 01

Developer insourcing

Emil Lundkvist

emil.lundkvist@omateq.com

+46 70 220 93 39

Group

Kristoffer Fredriksson

kristoffer.fredriksson@omateq.com

+46 73 800 71 85

”Transform your ideas into reality”

Let´s work together.

Follow

Visit us

Grevgatan 29

114 53 Stockholm

LEAVE IT IN OUR CARE

On a mission to perfect IT development