Agentic Engineering: Den kompletta guiden till AI-först-mjukvaruutveckling bortom vibe-kodning
Mars 2026 — Under 2025 introducerade Andrej Karpathy oss för vibe-kodning — att beskriva vad man vill ha och låta AI:n lista ut implementeringen. Det var roligt, snabbt och fungerade bra för prototyper.
Sedan försökte folk skicka vibe-kodad mjukvara till produktion. Resultaten var inte lysande.
I början av 2026 myntade Karpathy en ny term för vad som kommer härnäst: agentic engineering — disciplinen att designa system där AI-agenter planerar, skriver, testar och levererar kod under strukturerad mänsklig tillsyn. Inte informell prompting. Inte "hoppas-och-kolla". Utan en professionell ingenjörsmetodik byggd för AI-först-utveckling.
Siffrorna som backar upp detta skifte är verkliga: TELUS sparade 500 000+ timmar med 13 000 AI-lösningar. Zapier nådde 89 % AI-användning över hela organisationen. Stripes "Minions" producerar 1 000+ mergade PR:ar per vecka. Detta är inte teoretiskt — det är så mjukvara byggs just nu.
Från vibe-kodning till agentic engineering: Vad som har förändrats
Problemet med vibe-kodning
Vibe-kodning fungerar utmärkt för:
- Snabba prototyper och demon
- Personliga skript och engångsverktyg
- Lärande och utforskning
- Hackathon-projekt
Vibe-kodning misslyckas katastrofalt för:
- Produktionssystem med krav på drifttid
- Kodbaser som underhålls av team
- Applikationer med krav på säkerhet och efterlevnad
- Mjukvara som behöver utvecklas över månader och år
Misslyckandet har ett namn: AI-slask (AI slop) — kod som ser rimlig ut på ytan men saknar ordentlig felhantering, introducerar säkerhetshål, förstör befintlig funktionalitet eller skapar en arkitektur som inte går att underhålla. Utan strukturerad tillsyn genererar AI kod som ökar den tekniska skulden snabbare än den skapar värde.
Evolutionen
| Stadie | Era | Tillvägagångssätt | Mänsklig roll |
|---|---|---|---|
| Manuell kodning | Före 2023 | Människor skriver all kod | Författare |
| AI-assisterad kodning | 2023–2024 | AI föreslår kompletteringar | Författare med autocomplete |
| Vibe-kodning | 2025 | AI genererar från beskrivningar | Prompt-skribent |
| Agentic Engineering | 2026 | AI-agenter planerar, skriver, testar, levererar autonomt | Arkitekt och arbetsledare |
Den centrala insikten: agentic engineering tar inte bort behovet av ingenjörskunskap — den omdirigerar den. Istället för att skriva kod designar du systemen, begränsningarna och feedback-looparna som gör det möjligt för AI att skriva kod tillförlitligt.
Kärnramverket: Planera → Utföra → Verifiera (PEV)
Agentic engineering ersätter det informella "prompta och hoppas"-arbetsflödet med en strukturerad loop:
Planera (Plan)
Innan en agent skriver en enda rad kod:
- Definiera målet — Hur ser "färdigt" ut? Vilka är acceptanskriterierna?
- Dela upp i uppgifter — Bryt ner komplexa mål till agentstora arbetsenheter.
- Sätt begränsningar — Arkitektoniska gränser, regler för teknikstacken, stilguider.
- Specificera kvalitetskontroller — Vilka tester måste gå igenom? Vilka granskningar krävs?
- Tilldela agentroller — Vilken agent hanterar implementering? Testning? Säkerhetsgranskning?
Planeringsfasen är där ingenjörsexpertis betyder mest. En vag plan ger vag kod. En exakt plan med tydliga begränsningar ger fokuserad och granskningsbar output.
Utföra (Execute)
Agenter arbetar autonomt inom de begränsningar som definierats i planeringsfasen:
- Implementationsagenter skriver kod enligt arkitektoniska regler.
- Testagenter genererar och kör testsviter.
- Granskningsagenter kontrollerar stil, säkerhet och arkitektonisk efterlevnad.
- Dokumentationsagenter uppdaterar dokumentationen för att matcha kodändringarna.
Agenterna itererar tills deras arbete passerar kvalitetskontrollerna. Mänsklig intervention behövs endast när agenter kör fast eller när avvägningar kräver mänskligt omdöme.
Verifiera (Verify)
Människor granskar agentens resultat mot de ursprungliga målen:
- Uppfyller det acceptanskriterierna?
- Introducerades några säkerhetshål?
- Är arkitekturen konsistent med den befintliga kodbasen?
- Är testerna meningsfulla eller kontrollerar de bara "happy paths"?
- Skulle en mänsklig ingenjör godkänna denna PR?
Verifiering är inte en ren formalitet. Det är den fas där ingenjörsmässigt omdöme är som mest kritiskt — du utvärderar om agentens lösning inte bara är funktionell utan faktiskt bra.
Multi-agent-orkestrering: Kärnpraktiken
Agentic engineering handlar inte om en enda AI som gör allt. Det handlar om specialiserade agenter med definierade roller som samarbetar under mänsklig orkestrering.
Agent-team-modellen
| Agentroll | Ansvar | Exempel på verktyg |
|---|---|---|
| Feature-författare | Skriver implementationskod | Codex, Claude Code, Cursor |
| Testgenerator | Skapar enhets-, integrations- och E2E-tester | Codex, Claude Code |
| Kodgranskare | Kontrollerar stil, mönster, säkerhet | Anpassade LLM-baserade linters |
| Arkitekturväktare | Validerar strukturell efterlevnad | ArchUnit + LLM-auditör |
| Dokumentationsförfattare | Uppdaterar dokumentation | Codex, Claude Code |
| Säkerhetsskanner | Identifierar sårbarheter | AI-förstärkta SAST-verktyg |
| Release-ansvarig | Hanterar CI/CD, leveranskontroller | Anpassade agenter |
Hur de koordinerar
I praktiken följer multi-agent-arbetsflöden en pipeline:
Uppgiftsbeskrivning (Människa)
→ Feature-författare (skriver kod)
→ Testgenerator (skriver tester)
→ Kodgranskare (granskar ändringar)
→ Arkitekturväktare (kontrollerar efterlevnad)
→ Säkerhetsskanner (sårbarhetskontroll)
→ Mänsklig granskning (slutgiltigt godkännande)
→ CI/CD-pipeline (automatiserad driftsättning)
Varje agent producerar artefakter som matar nästa. Människan förblir beslutsfattare vid viktiga kontrollpunkter, men utförandet mellan kontrollpunkterna är helt autonomt.
Verkliga resultat: Vad företag uppnår
TELUS: 13 000 AI-lösningar, 500 000 timmar sparade
TELUS Digital rullade ut agentic engineering i hela sin organisation:
- 13 000+ anpassade AI-lösningar skapade.
- Ingenjörskod levererades 30 % snabbare.
- 500 000+ totala timmar sparade.
- Skalningen fortsatte även i team utanför IT.
Zapier: 89 % AI-användning i hela organisationen
Zapiers fokus låg på att göra agentverktyg tillgängliga för alla:
- 89 % AI-användning i hela organisationen.
- 800+ agenter driftsatta internt.
- Icke-ingenjörer använder agenter för arbetsflöden, dataanalys och innehåll.
Stripe: 1 000+ mergade PR:ar per vecka från agenter
Stripes interna Minions-system representerar mogen agentic engineering:
- Utvecklaren postar en uppgift i Slack.
- Minion skriver koden.
- Minion passerar CI.
- Minion öppnar en PR.
- En människa granskar och mergar.
Noll interaktion mellan uppgiftstilldelning och PR-granskning. Infrastrukturen (the harness) hanterar allt.
OpenAI: 1 miljon rader utan mänsklig kod
OpenAI:s egna Codex-team byggde en produktionsapplikation med:
- 1 miljon+ rader kod.
- Noll manuellt skrivna rader.
- ~1/10-del av tiden jämfört med traditionell utveckling.
- Interna dagliga användare och externa alfa-testare.
- Produkten levereras, driftsätts, går sönder och lagas — allt av agenter.
Rakuten: 12,5 miljoner rader kodbas på 7 timmar
Rakuten använde Claude Code för att slutföra en komplex vLLM-implementering över en kodbas på 12,5 miljoner rader på bara 7 timmar med 99,9 % numerisk noggrannhet.
Kompetensstacken för Agentic Engineering
Vad som förändras
| Traditionell färdighet | Motsvarighet i Agentic Engineering |
|---|---|
| Skriva kod | Specificera avsikt precist |
| Felsöka kod | Felsöka agentbeteende |
| Kodgranskning | Validering av agentens output |
| Testning | Design av teststrategi |
| Arkitektur | Design av begränsningssystem |
| Dokumentation | Maskinläsbar kunskapsutveckling |
| Projektledning | Multi-agent-orkestrering |
Vad som förblir detsamma
- Domänexpertis — Du behöver fortfarande veta hur bra mjukvara ser ut.
- Systemtänkande — Att förstå hur komponenter interagerar är viktigare än någonsin.
- Säkerhetsmedvetenhet — Agenter känner inte automatiskt till din hotbild.
- Kodläsning — Du läser mer kod än någonsin, du bara skriver den inte själv.
Vad som är nytt
- Prompt-design för agenter — Skiljer sig från chatbot-prompter; agent-prompter är operativa specifikationer.
- Harness-design — Att bygga de begränsningar, linters och feedback-loopar som håller agenter produktiva.
- Context engineering — Att säkerställa att agenter har rätt information vid rätt tidpunkt.
- Agentutvärdering — Att mäta om dina agenter förbättras eller försämras.
Hur man börjar med Agentic Engineering
Steg 1: Arbetsflöde med en enda agent
Om du för närvarande vibe-kodar, tillför struktur:
- Skriv en specifikation innan du promptar — Definiera vad "färdigt" innebär.
- Använd CLAUDE.md eller .cursorrules — Koda in dina konventioner.
- Kör tester innan du accepterar — Merga aldrig AI-kod som inte har testats.
- Granska diffar noggrant — Leta efter mönster av AI-slask (onödiga abstraktioner, redundant felhantering, hallucinerade API:er).
Steg 2: Multi-agent-pipeline
När du är bekväm med strukturerade arbetsflöden för en enskild agent:
- Lägg till en agent för testgenerering — Separera implementering från testning.
- Lägg till CI-validering — Automatiserade kvalitetskontroller mellan agenten och mänsklig granskning.
- Lägg till dokumentationsagenter — Håll dokumentationen synkroniserad med kodändringar.
- Börja spåra mätvärden — Agenternas framgångsgrad, avvisningsgrad vid granskning, antal buggar som introduceras.
Steg 3: Organisatoriskt införande
För team som skalar upp agentic engineering:
- Skapa interna spelböcker — Dokumentera hur agenter ska användas för olika typer av uppgifter.
- Definiera styrningspolicyer — Vad kräver mänsklig granskning? Vad kan mergas automatiskt?
- Bygg gemensamma "harnesses" — Standardiserade konfigurationer som kodar in teamets konventioner.
- Utbilda i granskning av agent-output — Skiljer sig från traditionell kodgranskning; fokusera på strukturella mönster och säkerhetsmönster.
- Mät affärsnyttan — Sparade timmar, förbättrad hastighet, kvalitetsmått.
Agentic Engineering vs. Relaterade begrepp
| Begrepp | Fokus | Omfattning |
|---|---|---|
| Vibe-kodning | Informell AI-assisterad utveckling | Enskild utvecklare, prototyper |
| Context Engineering | Optimering av modellens input/kontext | Enskild interaktion |
| Prompt Engineering | Utformning av effektiva prompter | Enskild prompt |
| Harness Engineering | Infrastruktur kring agenter | Design av agentsystem |
| Agentic Engineering | Komplett AI-först-metodik | Hela organisationen |
Sambandet:
- Prompt engineering → hur du pratar med modellen
- Context engineering → vad modellen vet
- Harness engineering → vad som begränsar modellen
- Agentic engineering → hur du bygger mjukvara med modellen
Agentic engineering omfattar alla tre och lägger till team-arbetsflöden, styrning, organisatorisk förändring och integration i affärsprocesser.
Säkerhetsdimensionen
Anthropics "Agentic Coding Report" från 2026 betonar att agentic engineering måste integrera säkerhet från dag ett:
- Agenter kan introducera sårbarheter i stor skala — En agent som skriver 1 000 PR:ar/vecka med 1 % sårbarhetsgrad skapar 10 nya sårbarheter varje vecka.
- Attackytan expanderar — Agenter som har tillgång till API:er, databaser och externa tjänster skapar nya vektorer.
- Automatiserat försvar krävs — Manuell säkerhetsgranskning kan inte hålla jämna steg med agent-genererad kod.
- Kvalitetskontroller måste inkludera säkerhet — Varje PEV-cykel bör inkludera automatiserad säkerhetsskanning.
Samma skalbarhet som gör agentic engineering kraftfull för utveckling gäller även för angripare. Att bygga in säkerhet i infrastrukturen (the harness) — istället för att lägga till den i efterhand — är ett absolut krav.
Vårt perspektiv: Att bygga AI-drivna produkter med Agentic Engineering
På NxCode har vi under de senaste månaderna gått från AI-assisterad utveckling till agentic engineering. Här är vad vi har lärt oss:
Vad som fungerar
- Strukturerade specifikationer före agent-körning — De 10 minuter som läggs på att skriva en tydlig spec sparar timmar av omarbete.
- Multi-provider agent-pipelines — Vi använder Claude för tunga arkitekturbeslut och Codex för högvolyms-implementering.
- Aggressiv CI-validering — Vår CI fångar upp ~15 % av agent-genererad kod som annars skulle ha introducerat buggar.
- Dokumentations-först-arbetsflöde — Att uppdatera dokumentationen innan koden skrivs (via agenter) håller kunskapsbasen uppdaterad för framtida agent-sessioner.
Vad som inte fungerar (ännu)
- Helt autonoma flerdagarsprojekt — Agenter behöver fortfarande mänskliga kontrollpunkter varannan eller var tredje timme för komplext arbete.
- Refaktorisering över flera system — Agenter hanterar refaktorisering av enstaka tjänster väl, men kämpar med koordinerade ändringar över mikrotjänster.
- Helt nya arkitekturbeslut — När det inte finns något föregående i kodbasen faller agenter tillbaka på generiska mönster som kanske inte passar den specifika kontexten.
Slutsatsen
Agentic engineering handlar inte om att ersätta utvecklare. Det handlar om att multiplicera vad varje utvecklare kan åstadkomma. De team som bemästrar denna disciplin kommer att leverera 5–10 gånger mer än de som fortfarande skriver varje rad för hand — inte för att AI:n är smartare, utan för att ingenjörsprocessen är bättre.
Viktiga slutsatser
- Agentic engineering är den professionella evolutionen bortom vibe-kodning — strukturerad tillsyn ersätter informell prompting.
- PEV-loopen (Planera → Utföra → Verifiera) är kärnan i arbetsflödet som ersätter "prompta och hoppas".
- Multi-agent-orkestrering använder specialiserade agenter (författare, testare, granskare, säkerhetsskanner) som arbetar koordinerat.
- Verkliga resultat är betydande: TELUS (500 000 timmar sparade), Zapier (89 % användning), Stripe (1 000+ PR:ar/vecka från agenter).
- Ingenjörens roll skiftar från att skriva kod till att designa system, specificera avsikt och validera output.
- Säkerhet måste byggas in från dag ett — utveckling i agent-skala kräver säkerhet i agent-skala.
- Börja med struktur: Skriv specar, koda in konventioner, kör tester, granska noggrant — och skala sedan upp.
Relaterade resurser
- Harness Engineering Complete Guide — Infrastrukturlagret som driver agentic engineering.
- The Agentic Web Explained: AGENTS.md, MCP vs A2A — Protokollstandarder för multi-agent-system.
- Cursor Cloud Agents: Autonomous Coding on VMs — Agentic engineering i praktiken med virtuella maskiner i molnet.
- Bygg din webbplats med NxCode — AI-driven webbutveckling med principer från agentic engineering.



