Vad är agentic engineering?

Agentic engineering är en disciplin inom mjukvaruutveckling där människor definierar mål, begränsningar och kvalitetsstandarder medan AI-agenter autonomt planerar, skriver, testar och distribuerar kod under strukturerad mänsklig tillsyn. Begreppet myntades av Andrej Karpathy i början av 2026 som den professionella evolutionen bortom vibe-kodning och betonar orkestrering, verifiering och styrning snarare än manuellt kodskrivande.

Hur skiljer sig agentic engineering från vibe-kodning?

Vibe-kodning är informell AI-prompting för snabb prototyptillverkning – du beskriver vad du vill ha och låter AI:n generera kod med minimal tillsyn. Agentic engineering tillför struktur: planeringsfaser, verifieringsloopar, kvalitetskontroller, säkerhetsgranskningar och styrning. Vibe-kodning producerar snabba demon; agentic engineering producerar produktionsklar mjukvara.

Vad är PEV-loopen inom agentic engineering?

PEV-loopen är kärnan i arbetsflödet: Planera (definiera mål, bryta ner uppgifter, sätta begränsningar), Utföra (AI-agenter skriver kod, kör tester, itererar), Verifiera (människor granskar resultat, validerar mot krav, godkänner ändringar). Denna strukturerade loop ersätter den informella 'prompta och hoppas'-metoden i vibe-kodning med en repeterbar ingenjörsprocess.

Vilka företag använder agentic engineering?

Stora användare inkluderar: TELUS (13 000+ anpassade AI-lösningar, 30 % snabbare utveckling, 500 000 timmar sparade), Zapier (89 % AI-användning, 800+ agenter driftsatta), Stripe (Minions-agenter som producerar 1 000+ mergade PR:ar per vecka) och OpenAI själva (1M+ rader kod utan mänskligt skriven kod via Codex). Anthropics rapport från 2026 dokumenterar en utbredd användning i företagsvärlden.

Vilka färdigheter behöver jag för agentic engineering?

Viktiga färdigheter inkluderar: systemarkitektur (designa miljöer för agenter), specifikationsskrivande (artikulera avsikt precist), validering och teststrategi, multi-agent-orkestrering (koordinera specialiserade agenter), säkerhet och styrning (bygga kvalitetskontroller) samt domänexpertis (veta hur ett bra resultat ser ut). Kodningskunskap förblir viktig för att förstå och granska agenternas output.

Hur relaterar agentic engineering till harness engineering och context engineering?

Context engineering fokuserar på vilken information modellen ser i en enskild interaktion. Harness engineering fokuserar på infrastrukturen som begränsar och möjliggör agenter (linters, CI, arkitektoniska regler). Agentic engineering är den övergripande disciplinen som omfattar båda – det är den kompletta metodiken för att bygga mjukvara med AI-agenter, inklusive teamroller, styrning, arbetsflöden och organisatorisk förändring.

Agentic Engineering: Den kompletta guiden till AI-först-mjukvaruutveckling bortom vibe-kodning

Mars 2026 — Under 2025 introducerade Andrej Karpathy oss för vibe-kodning — att beskriva vad man vill ha och låta AI:n lista ut implementeringen. Det var roligt, snabbt och fungerade bra för prototyper.

Sedan försökte folk skicka vibe-kodad mjukvara till produktion. Resultaten var inte lysande.

I början av 2026 myntade Karpathy en ny term för vad som kommer härnäst: agentic engineering — disciplinen att designa system där AI-agenter planerar, skriver, testar och levererar kod under strukturerad mänsklig tillsyn. Inte informell prompting. Inte "hoppas-och-kolla". Utan en professionell ingenjörsmetodik byggd för AI-först-utveckling.

Siffrorna som backar upp detta skifte är verkliga: TELUS sparade 500 000+ timmar med 13 000 AI-lösningar. Zapier nådde 89 % AI-användning över hela organisationen. Stripes "Minions" producerar 1 000+ mergade PR:ar per vecka. Detta är inte teoretiskt — det är så mjukvara byggs just nu.

Från vibe-kodning till agentic engineering: Vad som har förändrats

Problemet med vibe-kodning

Vibe-kodning fungerar utmärkt för:

Snabba prototyper och demon
Personliga skript och engångsverktyg
Lärande och utforskning
Hackathon-projekt

Vibe-kodning misslyckas katastrofalt för:

Produktionssystem med krav på drifttid
Kodbaser som underhålls av team
Applikationer med krav på säkerhet och efterlevnad
Mjukvara som behöver utvecklas över månader och år

Misslyckandet har ett namn: AI-slask (AI slop) — kod som ser rimlig ut på ytan men saknar ordentlig felhantering, introducerar säkerhetshål, förstör befintlig funktionalitet eller skapar en arkitektur som inte går att underhålla. Utan strukturerad tillsyn genererar AI kod som ökar den tekniska skulden snabbare än den skapar värde.

Evolutionen

Stadie	Era	Tillvägagångssätt	Mänsklig roll
Manuell kodning	Före 2023	Människor skriver all kod	Författare
AI-assisterad kodning	2023–2024	AI föreslår kompletteringar	Författare med autocomplete
Vibe-kodning	2025	AI genererar från beskrivningar	Prompt-skribent
Agentic Engineering	2026	AI-agenter planerar, skriver, testar, levererar autonomt	Arkitekt och arbetsledare

Den centrala insikten: agentic engineering tar inte bort behovet av ingenjörskunskap — den omdirigerar den. Istället för att skriva kod designar du systemen, begränsningarna och feedback-looparna som gör det möjligt för AI att skriva kod tillförlitligt.

Kärnramverket: Planera → Utföra → Verifiera (PEV)

Agentic engineering ersätter det informella "prompta och hoppas"-arbetsflödet med en strukturerad loop:

Planera (Plan)

Innan en agent skriver en enda rad kod:

Definiera målet — Hur ser "färdigt" ut? Vilka är acceptanskriterierna?
Dela upp i uppgifter — Bryt ner komplexa mål till agentstora arbetsenheter.
Sätt begränsningar — Arkitektoniska gränser, regler för teknikstacken, stilguider.
Specificera kvalitetskontroller — Vilka tester måste gå igenom? Vilka granskningar krävs?
Tilldela agentroller — Vilken agent hanterar implementering? Testning? Säkerhetsgranskning?

Planeringsfasen är där ingenjörsexpertis betyder mest. En vag plan ger vag kod. En exakt plan med tydliga begränsningar ger fokuserad och granskningsbar output.

Utföra (Execute)

Agenter arbetar autonomt inom de begränsningar som definierats i planeringsfasen:

Implementationsagenter skriver kod enligt arkitektoniska regler.
Testagenter genererar och kör testsviter.
Granskningsagenter kontrollerar stil, säkerhet och arkitektonisk efterlevnad.
Dokumentationsagenter uppdaterar dokumentationen för att matcha kodändringarna.

Agenterna itererar tills deras arbete passerar kvalitetskontrollerna. Mänsklig intervention behövs endast när agenter kör fast eller när avvägningar kräver mänskligt omdöme.

Verifiera (Verify)

Människor granskar agentens resultat mot de ursprungliga målen:

Uppfyller det acceptanskriterierna?
Introducerades några säkerhetshål?
Är arkitekturen konsistent med den befintliga kodbasen?
Är testerna meningsfulla eller kontrollerar de bara "happy paths"?
Skulle en mänsklig ingenjör godkänna denna PR?

Verifiering är inte en ren formalitet. Det är den fas där ingenjörsmässigt omdöme är som mest kritiskt — du utvärderar om agentens lösning inte bara är funktionell utan faktiskt bra.

Multi-agent-orkestrering: Kärnpraktiken

Agentic engineering handlar inte om en enda AI som gör allt. Det handlar om specialiserade agenter med definierade roller som samarbetar under mänsklig orkestrering.

Agent-team-modellen

Agentroll	Ansvar	Exempel på verktyg
Feature-författare	Skriver implementationskod	Codex, Claude Code, Cursor
Testgenerator	Skapar enhets-, integrations- och E2E-tester	Codex, Claude Code
Kodgranskare	Kontrollerar stil, mönster, säkerhet	Anpassade LLM-baserade linters
Arkitekturväktare	Validerar strukturell efterlevnad	ArchUnit + LLM-auditör
Dokumentationsförfattare	Uppdaterar dokumentation	Codex, Claude Code
Säkerhetsskanner	Identifierar sårbarheter	AI-förstärkta SAST-verktyg
Release-ansvarig	Hanterar CI/CD, leveranskontroller	Anpassade agenter

Hur de koordinerar

I praktiken följer multi-agent-arbetsflöden en pipeline:

Uppgiftsbeskrivning (Människa)
  → Feature-författare (skriver kod)
  → Testgenerator (skriver tester)
  → Kodgranskare (granskar ändringar)
  → Arkitekturväktare (kontrollerar efterlevnad)
  → Säkerhetsskanner (sårbarhetskontroll)
  → Mänsklig granskning (slutgiltigt godkännande)
  → CI/CD-pipeline (automatiserad driftsättning)

Varje agent producerar artefakter som matar nästa. Människan förblir beslutsfattare vid viktiga kontrollpunkter, men utförandet mellan kontrollpunkterna är helt autonomt.

Verkliga resultat: Vad företag uppnår

TELUS: 13 000 AI-lösningar, 500 000 timmar sparade

TELUS Digital rullade ut agentic engineering i hela sin organisation:

13 000+ anpassade AI-lösningar skapade.
Ingenjörskod levererades 30 % snabbare.
500 000+ totala timmar sparade.
Skalningen fortsatte även i team utanför IT.

Zapier: 89 % AI-användning i hela organisationen

Zapiers fokus låg på att göra agentverktyg tillgängliga för alla:

89 % AI-användning i hela organisationen.
800+ agenter driftsatta internt.
Icke-ingenjörer använder agenter för arbetsflöden, dataanalys och innehåll.

Stripe: 1 000+ mergade PR:ar per vecka från agenter

Stripes interna Minions-system representerar mogen agentic engineering:

Utvecklaren postar en uppgift i Slack.
Minion skriver koden.
Minion passerar CI.
Minion öppnar en PR.
En människa granskar och mergar.

Noll interaktion mellan uppgiftstilldelning och PR-granskning. Infrastrukturen (the harness) hanterar allt.

OpenAI: 1 miljon rader utan mänsklig kod

OpenAI:s egna Codex-team byggde en produktionsapplikation med:

1 miljon+ rader kod.
Noll manuellt skrivna rader.
~1/10-del av tiden jämfört med traditionell utveckling.
Interna dagliga användare och externa alfa-testare.
Produkten levereras, driftsätts, går sönder och lagas — allt av agenter.

Rakuten: 12,5 miljoner rader kodbas på 7 timmar

Rakuten använde Claude Code för att slutföra en komplex vLLM-implementering över en kodbas på 12,5 miljoner rader på bara 7 timmar med 99,9 % numerisk noggrannhet.

Kompetensstacken för Agentic Engineering

Vad som förändras

Traditionell färdighet	Motsvarighet i Agentic Engineering
Skriva kod	Specificera avsikt precist
Felsöka kod	Felsöka agentbeteende
Kodgranskning	Validering av agentens output
Testning	Design av teststrategi
Arkitektur	Design av begränsningssystem
Dokumentation	Maskinläsbar kunskapsutveckling
Projektledning	Multi-agent-orkestrering

Vad som förblir detsamma

Domänexpertis — Du behöver fortfarande veta hur bra mjukvara ser ut.
Systemtänkande — Att förstå hur komponenter interagerar är viktigare än någonsin.
Säkerhetsmedvetenhet — Agenter känner inte automatiskt till din hotbild.
Kodläsning — Du läser mer kod än någonsin, du bara skriver den inte själv.

Vad som är nytt

Prompt-design för agenter — Skiljer sig från chatbot-prompter; agent-prompter är operativa specifikationer.
Harness-design — Att bygga de begränsningar, linters och feedback-loopar som håller agenter produktiva.
Context engineering — Att säkerställa att agenter har rätt information vid rätt tidpunkt.
Agentutvärdering — Att mäta om dina agenter förbättras eller försämras.

Hur man börjar med Agentic Engineering

Steg 1: Arbetsflöde med en enda agent

Om du för närvarande vibe-kodar, tillför struktur:

Skriv en specifikation innan du promptar — Definiera vad "färdigt" innebär.
Använd CLAUDE.md eller .cursorrules — Koda in dina konventioner.
Kör tester innan du accepterar — Merga aldrig AI-kod som inte har testats.
Granska diffar noggrant — Leta efter mönster av AI-slask (onödiga abstraktioner, redundant felhantering, hallucinerade API:er).

Steg 2: Multi-agent-pipeline

När du är bekväm med strukturerade arbetsflöden för en enskild agent:

Lägg till en agent för testgenerering — Separera implementering från testning.
Lägg till CI-validering — Automatiserade kvalitetskontroller mellan agenten och mänsklig granskning.
Lägg till dokumentationsagenter — Håll dokumentationen synkroniserad med kodändringar.
Börja spåra mätvärden — Agenternas framgångsgrad, avvisningsgrad vid granskning, antal buggar som introduceras.

Steg 3: Organisatoriskt införande

För team som skalar upp agentic engineering:

Skapa interna spelböcker — Dokumentera hur agenter ska användas för olika typer av uppgifter.
Definiera styrningspolicyer — Vad kräver mänsklig granskning? Vad kan mergas automatiskt?
Bygg gemensamma "harnesses" — Standardiserade konfigurationer som kodar in teamets konventioner.
Utbilda i granskning av agent-output — Skiljer sig från traditionell kodgranskning; fokusera på strukturella mönster och säkerhetsmönster.
Mät affärsnyttan — Sparade timmar, förbättrad hastighet, kvalitetsmått.

Agentic Engineering vs. Relaterade begrepp

Begrepp	Fokus	Omfattning
Vibe-kodning	Informell AI-assisterad utveckling	Enskild utvecklare, prototyper
Context Engineering	Optimering av modellens input/kontext	Enskild interaktion
Prompt Engineering	Utformning av effektiva prompter	Enskild prompt
Harness Engineering	Infrastruktur kring agenter	Design av agentsystem
Agentic Engineering	Komplett AI-först-metodik	Hela organisationen

Sambandet:

Prompt engineering → hur du pratar med modellen
Context engineering → vad modellen vet
Harness engineering → vad som begränsar modellen
Agentic engineering → hur du bygger mjukvara med modellen

Agentic engineering omfattar alla tre och lägger till team-arbetsflöden, styrning, organisatorisk förändring och integration i affärsprocesser.

Säkerhetsdimensionen

Anthropics "Agentic Coding Report" från 2026 betonar att agentic engineering måste integrera säkerhet från dag ett:

Agenter kan introducera sårbarheter i stor skala — En agent som skriver 1 000 PR:ar/vecka med 1 % sårbarhetsgrad skapar 10 nya sårbarheter varje vecka.
Attackytan expanderar — Agenter som har tillgång till API:er, databaser och externa tjänster skapar nya vektorer.
Automatiserat försvar krävs — Manuell säkerhetsgranskning kan inte hålla jämna steg med agent-genererad kod.
Kvalitetskontroller måste inkludera säkerhet — Varje PEV-cykel bör inkludera automatiserad säkerhetsskanning.

Samma skalbarhet som gör agentic engineering kraftfull för utveckling gäller även för angripare. Att bygga in säkerhet i infrastrukturen (the harness) — istället för att lägga till den i efterhand — är ett absolut krav.

Vårt perspektiv: Att bygga AI-drivna produkter med Agentic Engineering

På NxCode har vi under de senaste månaderna gått från AI-assisterad utveckling till agentic engineering. Här är vad vi har lärt oss:

Vad som fungerar

Strukturerade specifikationer före agent-körning — De 10 minuter som läggs på att skriva en tydlig spec sparar timmar av omarbete.
Multi-provider agent-pipelines — Vi använder Claude för tunga arkitekturbeslut och Codex för högvolyms-implementering.
Aggressiv CI-validering — Vår CI fångar upp ~15 % av agent-genererad kod som annars skulle ha introducerat buggar.
Dokumentations-först-arbetsflöde — Att uppdatera dokumentationen innan koden skrivs (via agenter) håller kunskapsbasen uppdaterad för framtida agent-sessioner.

Vad som inte fungerar (ännu)

Helt autonoma flerdagarsprojekt — Agenter behöver fortfarande mänskliga kontrollpunkter varannan eller var tredje timme för komplext arbete.
Refaktorisering över flera system — Agenter hanterar refaktorisering av enstaka tjänster väl, men kämpar med koordinerade ändringar över mikrotjänster.
Helt nya arkitekturbeslut — När det inte finns något föregående i kodbasen faller agenter tillbaka på generiska mönster som kanske inte passar den specifika kontexten.

Slutsatsen

Agentic engineering handlar inte om att ersätta utvecklare. Det handlar om att multiplicera vad varje utvecklare kan åstadkomma. De team som bemästrar denna disciplin kommer att leverera 5–10 gånger mer än de som fortfarande skriver varje rad för hand — inte för att AI:n är smartare, utan för att ingenjörsprocessen är bättre.

Viktiga slutsatser

Agentic engineering är den professionella evolutionen bortom vibe-kodning — strukturerad tillsyn ersätter informell prompting.
PEV-loopen (Planera → Utföra → Verifiera) är kärnan i arbetsflödet som ersätter "prompta och hoppas".
Multi-agent-orkestrering använder specialiserade agenter (författare, testare, granskare, säkerhetsskanner) som arbetar koordinerat.
Verkliga resultat är betydande: TELUS (500 000 timmar sparade), Zapier (89 % användning), Stripe (1 000+ PR:ar/vecka från agenter).
Ingenjörens roll skiftar från att skriva kod till att designa system, specificera avsikt och validera output.
Säkerhet måste byggas in från dag ett — utveckling i agent-skala kräver säkerhet i agent-skala.
Börja med struktur: Skriv specar, koda in konventioner, kör tester, granska noggrant — och skala sedan upp.

Relaterade resurser

Harness Engineering Complete Guide — Infrastrukturlagret som driver agentic engineering.
The Agentic Web Explained: AGENTS.md, MCP vs A2A — Protokollstandarder för multi-agent-system.
Cursor Cloud Agents: Autonomous Coding on VMs — Agentic engineering i praktiken med virtuella maskiner i molnet.
Bygg din webbplats med NxCode — AI-driven webbutveckling med principer från agentic engineering.

Agentic Engineering: Den kompletta guiden till AI-först-mjukvaruutveckling bortom vibe-kodning (2026)