Agentic Engineering: Den kompletta guiden till AI-först-mjukvaruutveckling bortom vibe-kodning (2026)
← Back to news

Agentic Engineering: Den kompletta guiden till AI-först-mjukvaruutveckling bortom vibe-kodning (2026)

N

NxCode Team

9 min read

Agentic Engineering: Den kompletta guiden till AI-först-mjukvaruutveckling bortom vibe-kodning

Mars 2026 — Under 2025 introducerade Andrej Karpathy oss för vibe-kodning — att beskriva vad man vill ha och låta AI:n lista ut implementeringen. Det var roligt, snabbt och fungerade bra för prototyper.

Sedan försökte folk skicka vibe-kodad mjukvara till produktion. Resultaten var inte lysande.

I början av 2026 myntade Karpathy en ny term för vad som kommer härnäst: agentic engineering — disciplinen att designa system där AI-agenter planerar, skriver, testar och levererar kod under strukturerad mänsklig tillsyn. Inte informell prompting. Inte "hoppas-och-kolla". Utan en professionell ingenjörsmetodik byggd för AI-först-utveckling.

Siffrorna som backar upp detta skifte är verkliga: TELUS sparade 500 000+ timmar med 13 000 AI-lösningar. Zapier nådde 89 % AI-användning över hela organisationen. Stripes "Minions" producerar 1 000+ mergade PR:ar per vecka. Detta är inte teoretiskt — det är så mjukvara byggs just nu.


Från vibe-kodning till agentic engineering: Vad som har förändrats

Problemet med vibe-kodning

Vibe-kodning fungerar utmärkt för:

  • Snabba prototyper och demon
  • Personliga skript och engångsverktyg
  • Lärande och utforskning
  • Hackathon-projekt

Vibe-kodning misslyckas katastrofalt för:

  • Produktionssystem med krav på drifttid
  • Kodbaser som underhålls av team
  • Applikationer med krav på säkerhet och efterlevnad
  • Mjukvara som behöver utvecklas över månader och år

Misslyckandet har ett namn: AI-slask (AI slop) — kod som ser rimlig ut på ytan men saknar ordentlig felhantering, introducerar säkerhetshål, förstör befintlig funktionalitet eller skapar en arkitektur som inte går att underhålla. Utan strukturerad tillsyn genererar AI kod som ökar den tekniska skulden snabbare än den skapar värde.

Evolutionen

StadieEraTillvägagångssättMänsklig roll
Manuell kodningFöre 2023Människor skriver all kodFörfattare
AI-assisterad kodning2023–2024AI föreslår kompletteringarFörfattare med autocomplete
Vibe-kodning2025AI genererar från beskrivningarPrompt-skribent
Agentic Engineering2026AI-agenter planerar, skriver, testar, levererar autonomtArkitekt och arbetsledare

Den centrala insikten: agentic engineering tar inte bort behovet av ingenjörskunskap — den omdirigerar den. Istället för att skriva kod designar du systemen, begränsningarna och feedback-looparna som gör det möjligt för AI att skriva kod tillförlitligt.


Kärnramverket: Planera → Utföra → Verifiera (PEV)

Agentic engineering ersätter det informella "prompta och hoppas"-arbetsflödet med en strukturerad loop:

Planera (Plan)

Innan en agent skriver en enda rad kod:

  1. Definiera målet — Hur ser "färdigt" ut? Vilka är acceptanskriterierna?
  2. Dela upp i uppgifter — Bryt ner komplexa mål till agentstora arbetsenheter.
  3. Sätt begränsningar — Arkitektoniska gränser, regler för teknikstacken, stilguider.
  4. Specificera kvalitetskontroller — Vilka tester måste gå igenom? Vilka granskningar krävs?
  5. Tilldela agentroller — Vilken agent hanterar implementering? Testning? Säkerhetsgranskning?

Planeringsfasen är där ingenjörsexpertis betyder mest. En vag plan ger vag kod. En exakt plan med tydliga begränsningar ger fokuserad och granskningsbar output.

Utföra (Execute)

Agenter arbetar autonomt inom de begränsningar som definierats i planeringsfasen:

  • Implementationsagenter skriver kod enligt arkitektoniska regler.
  • Testagenter genererar och kör testsviter.
  • Granskningsagenter kontrollerar stil, säkerhet och arkitektonisk efterlevnad.
  • Dokumentationsagenter uppdaterar dokumentationen för att matcha kodändringarna.

Agenterna itererar tills deras arbete passerar kvalitetskontrollerna. Mänsklig intervention behövs endast när agenter kör fast eller när avvägningar kräver mänskligt omdöme.

Verifiera (Verify)

Människor granskar agentens resultat mot de ursprungliga målen:

  • Uppfyller det acceptanskriterierna?
  • Introducerades några säkerhetshål?
  • Är arkitekturen konsistent med den befintliga kodbasen?
  • Är testerna meningsfulla eller kontrollerar de bara "happy paths"?
  • Skulle en mänsklig ingenjör godkänna denna PR?

Verifiering är inte en ren formalitet. Det är den fas där ingenjörsmässigt omdöme är som mest kritiskt — du utvärderar om agentens lösning inte bara är funktionell utan faktiskt bra.


Multi-agent-orkestrering: Kärnpraktiken

Agentic engineering handlar inte om en enda AI som gör allt. Det handlar om specialiserade agenter med definierade roller som samarbetar under mänsklig orkestrering.

Agent-team-modellen

AgentrollAnsvarExempel på verktyg
Feature-författareSkriver implementationskodCodex, Claude Code, Cursor
TestgeneratorSkapar enhets-, integrations- och E2E-testerCodex, Claude Code
KodgranskareKontrollerar stil, mönster, säkerhetAnpassade LLM-baserade linters
ArkitekturväktareValiderar strukturell efterlevnadArchUnit + LLM-auditör
DokumentationsförfattareUppdaterar dokumentationCodex, Claude Code
SäkerhetsskannerIdentifierar sårbarheterAI-förstärkta SAST-verktyg
Release-ansvarigHanterar CI/CD, leveranskontrollerAnpassade agenter

Hur de koordinerar

I praktiken följer multi-agent-arbetsflöden en pipeline:

Uppgiftsbeskrivning (Människa)
  → Feature-författare (skriver kod)
  → Testgenerator (skriver tester)
  → Kodgranskare (granskar ändringar)
  → Arkitekturväktare (kontrollerar efterlevnad)
  → Säkerhetsskanner (sårbarhetskontroll)
  → Mänsklig granskning (slutgiltigt godkännande)
  → CI/CD-pipeline (automatiserad driftsättning)

Varje agent producerar artefakter som matar nästa. Människan förblir beslutsfattare vid viktiga kontrollpunkter, men utförandet mellan kontrollpunkterna är helt autonomt.


Verkliga resultat: Vad företag uppnår

TELUS: 13 000 AI-lösningar, 500 000 timmar sparade

TELUS Digital rullade ut agentic engineering i hela sin organisation:

  • 13 000+ anpassade AI-lösningar skapade.
  • Ingenjörskod levererades 30 % snabbare.
  • 500 000+ totala timmar sparade.
  • Skalningen fortsatte även i team utanför IT.

Zapier: 89 % AI-användning i hela organisationen

Zapiers fokus låg på att göra agentverktyg tillgängliga för alla:

  • 89 % AI-användning i hela organisationen.
  • 800+ agenter driftsatta internt.
  • Icke-ingenjörer använder agenter för arbetsflöden, dataanalys och innehåll.

Stripe: 1 000+ mergade PR:ar per vecka från agenter

Stripes interna Minions-system representerar mogen agentic engineering:

  1. Utvecklaren postar en uppgift i Slack.
  2. Minion skriver koden.
  3. Minion passerar CI.
  4. Minion öppnar en PR.
  5. En människa granskar och mergar.

Noll interaktion mellan uppgiftstilldelning och PR-granskning. Infrastrukturen (the harness) hanterar allt.

OpenAI: 1 miljon rader utan mänsklig kod

OpenAI:s egna Codex-team byggde en produktionsapplikation med:

  • 1 miljon+ rader kod.
  • Noll manuellt skrivna rader.
  • ~1/10-del av tiden jämfört med traditionell utveckling.
  • Interna dagliga användare och externa alfa-testare.
  • Produkten levereras, driftsätts, går sönder och lagas — allt av agenter.

Rakuten: 12,5 miljoner rader kodbas på 7 timmar

Rakuten använde Claude Code för att slutföra en komplex vLLM-implementering över en kodbas på 12,5 miljoner rader på bara 7 timmar med 99,9 % numerisk noggrannhet.


Kompetensstacken för Agentic Engineering

Vad som förändras

Traditionell färdighetMotsvarighet i Agentic Engineering
Skriva kodSpecificera avsikt precist
Felsöka kodFelsöka agentbeteende
KodgranskningValidering av agentens output
TestningDesign av teststrategi
ArkitekturDesign av begränsningssystem
DokumentationMaskinläsbar kunskapsutveckling
ProjektledningMulti-agent-orkestrering

Vad som förblir detsamma

  • Domänexpertis — Du behöver fortfarande veta hur bra mjukvara ser ut.
  • Systemtänkande — Att förstå hur komponenter interagerar är viktigare än någonsin.
  • Säkerhetsmedvetenhet — Agenter känner inte automatiskt till din hotbild.
  • Kodläsning — Du läser mer kod än någonsin, du bara skriver den inte själv.

Vad som är nytt

  • Prompt-design för agenter — Skiljer sig från chatbot-prompter; agent-prompter är operativa specifikationer.
  • Harness-design — Att bygga de begränsningar, linters och feedback-loopar som håller agenter produktiva.
  • Context engineering — Att säkerställa att agenter har rätt information vid rätt tidpunkt.
  • Agentutvärdering — Att mäta om dina agenter förbättras eller försämras.

Hur man börjar med Agentic Engineering

Steg 1: Arbetsflöde med en enda agent

Om du för närvarande vibe-kodar, tillför struktur:

  1. Skriv en specifikation innan du promptar — Definiera vad "färdigt" innebär.
  2. Använd CLAUDE.md eller .cursorrules — Koda in dina konventioner.
  3. Kör tester innan du accepterar — Merga aldrig AI-kod som inte har testats.
  4. Granska diffar noggrant — Leta efter mönster av AI-slask (onödiga abstraktioner, redundant felhantering, hallucinerade API:er).

Steg 2: Multi-agent-pipeline

När du är bekväm med strukturerade arbetsflöden för en enskild agent:

  1. Lägg till en agent för testgenerering — Separera implementering från testning.
  2. Lägg till CI-validering — Automatiserade kvalitetskontroller mellan agenten och mänsklig granskning.
  3. Lägg till dokumentationsagenter — Håll dokumentationen synkroniserad med kodändringar.
  4. Börja spåra mätvärden — Agenternas framgångsgrad, avvisningsgrad vid granskning, antal buggar som introduceras.

Steg 3: Organisatoriskt införande

För team som skalar upp agentic engineering:

  1. Skapa interna spelböcker — Dokumentera hur agenter ska användas för olika typer av uppgifter.
  2. Definiera styrningspolicyer — Vad kräver mänsklig granskning? Vad kan mergas automatiskt?
  3. Bygg gemensamma "harnesses" — Standardiserade konfigurationer som kodar in teamets konventioner.
  4. Utbilda i granskning av agent-output — Skiljer sig från traditionell kodgranskning; fokusera på strukturella mönster och säkerhetsmönster.
  5. Mät affärsnyttan — Sparade timmar, förbättrad hastighet, kvalitetsmått.

Agentic Engineering vs. Relaterade begrepp

BegreppFokusOmfattning
Vibe-kodningInformell AI-assisterad utvecklingEnskild utvecklare, prototyper
Context EngineeringOptimering av modellens input/kontextEnskild interaktion
Prompt EngineeringUtformning av effektiva prompterEnskild prompt
Harness EngineeringInfrastruktur kring agenterDesign av agentsystem
Agentic EngineeringKomplett AI-först-metodikHela organisationen

Sambandet:

  • Prompt engineering → hur du pratar med modellen
  • Context engineering → vad modellen vet
  • Harness engineering → vad som begränsar modellen
  • Agentic engineering → hur du bygger mjukvara med modellen

Agentic engineering omfattar alla tre och lägger till team-arbetsflöden, styrning, organisatorisk förändring och integration i affärsprocesser.


Säkerhetsdimensionen

Anthropics "Agentic Coding Report" från 2026 betonar att agentic engineering måste integrera säkerhet från dag ett:

  • Agenter kan introducera sårbarheter i stor skala — En agent som skriver 1 000 PR:ar/vecka med 1 % sårbarhetsgrad skapar 10 nya sårbarheter varje vecka.
  • Attackytan expanderar — Agenter som har tillgång till API:er, databaser och externa tjänster skapar nya vektorer.
  • Automatiserat försvar krävs — Manuell säkerhetsgranskning kan inte hålla jämna steg med agent-genererad kod.
  • Kvalitetskontroller måste inkludera säkerhet — Varje PEV-cykel bör inkludera automatiserad säkerhetsskanning.

Samma skalbarhet som gör agentic engineering kraftfull för utveckling gäller även för angripare. Att bygga in säkerhet i infrastrukturen (the harness) — istället för att lägga till den i efterhand — är ett absolut krav.


Vårt perspektiv: Att bygga AI-drivna produkter med Agentic Engineering

NxCode har vi under de senaste månaderna gått från AI-assisterad utveckling till agentic engineering. Här är vad vi har lärt oss:

Vad som fungerar

  • Strukturerade specifikationer före agent-körning — De 10 minuter som läggs på att skriva en tydlig spec sparar timmar av omarbete.
  • Multi-provider agent-pipelines — Vi använder Claude för tunga arkitekturbeslut och Codex för högvolyms-implementering.
  • Aggressiv CI-validering — Vår CI fångar upp ~15 % av agent-genererad kod som annars skulle ha introducerat buggar.
  • Dokumentations-först-arbetsflöde — Att uppdatera dokumentationen innan koden skrivs (via agenter) håller kunskapsbasen uppdaterad för framtida agent-sessioner.

Vad som inte fungerar (ännu)

  • Helt autonoma flerdagarsprojekt — Agenter behöver fortfarande mänskliga kontrollpunkter varannan eller var tredje timme för komplext arbete.
  • Refaktorisering över flera system — Agenter hanterar refaktorisering av enstaka tjänster väl, men kämpar med koordinerade ändringar över mikrotjänster.
  • Helt nya arkitekturbeslut — När det inte finns något föregående i kodbasen faller agenter tillbaka på generiska mönster som kanske inte passar den specifika kontexten.

Slutsatsen

Agentic engineering handlar inte om att ersätta utvecklare. Det handlar om att multiplicera vad varje utvecklare kan åstadkomma. De team som bemästrar denna disciplin kommer att leverera 5–10 gånger mer än de som fortfarande skriver varje rad för hand — inte för att AI:n är smartare, utan för att ingenjörsprocessen är bättre.


Viktiga slutsatser

  1. Agentic engineering är den professionella evolutionen bortom vibe-kodning — strukturerad tillsyn ersätter informell prompting.
  2. PEV-loopen (Planera → Utföra → Verifiera) är kärnan i arbetsflödet som ersätter "prompta och hoppas".
  3. Multi-agent-orkestrering använder specialiserade agenter (författare, testare, granskare, säkerhetsskanner) som arbetar koordinerat.
  4. Verkliga resultat är betydande: TELUS (500 000 timmar sparade), Zapier (89 % användning), Stripe (1 000+ PR:ar/vecka från agenter).
  5. Ingenjörens roll skiftar från att skriva kod till att designa system, specificera avsikt och validera output.
  6. Säkerhet måste byggas in från dag ett — utveckling i agent-skala kräver säkerhet i agent-skala.
  7. Börja med struktur: Skriv specar, koda in konventioner, kör tester, granska noggrant — och skala sedan upp.

Relaterade resurser

Back to all news
Enjoyed this article?

Bygg med NxCode

Förvandla din idé till en fungerande app — ingen kodning krävs.

46 000+ utvecklare byggde med NxCode den här månaden

Prova själv

Beskriv vad du vill — NxCode bygger det åt dig.

46 000+ utvecklare byggde med NxCode den här månaden