Cos'è l'agentic engineering?

L'agentic engineering è una disciplina di sviluppo software in cui gli esseri umani definiscono obiettivi, vincoli e standard di qualità, mentre gli agenti IA pianificano, scrivono, testano e distribuiscono il codice in modo autonomo sotto una supervisione umana strutturata. Coniato da Andrej Karpathy all'inizio del 2026 come l'evoluzione professionale oltre il vibe coding, pone l'accento su orchestrazione, verifica e governance piuttosto che sulla scrittura manuale del codice.

In che cosa l'agentic engineering differisce dal vibe coding?

Il vibe coding è un prompting IA casuale e libero per la prototipazione rapida: descrivi ciò che vuoi e lasci che l'IA generi codice con una supervisione minima. L'agentic engineering aggiunge struttura: fasi di pianificazione, loop di verifica, gate di qualità, revisioni di sicurezza e governance. Il vibe coding produce demo veloci; l'agentic engineering produce software pronto per la produzione.

Cos'è il loop PEV nell'agentic engineering?

Il loop PEV è il ciclo di workflow principale: Plan (definire obiettivi, scomporre compiti, impostare vincoli), Execute (gli agenti IA scrivono codice, eseguono test, iterano), Verify (gli umani revisionano l'output, lo convalidano rispetto ai requisiti, approvano le modifiche). Questo loop strutturato sostituisce l'approccio informale 'prometti e spera' del vibe coding con un processo ingegneristico ripetibile.

Quali aziende utilizzano l'agentic engineering?

I principali utilizzatori includono: TELUS (oltre 13.000 soluzioni IA personalizzate, ingegneria più veloce del 30%, 500.000 ore risparmiate), Zapier (89% di adozione dell'IA, oltre 800 agenti distribuiti), Stripe (agenti Minions che producono oltre 1.000 PR unite a settimana) e la stessa OpenAI (oltre 1 milione di righe di codice con zero codice scritto da umani tramite Codex). Il rapporto 2026 di Anthropic documenta una diffusa adozione aziendale.

Di quali competenze ho bisogno per l'agentic engineering?

Le competenze chiave includono: architettura dei sistemi (progettazione di ambienti per agenti), scrittura di specifiche (articolare l'intento con precisione), strategia di validazione e test, orchestrazione multi-agente (coordinamento di agenti specializzati), sicurezza e governance (costruzione di gate di qualità) e competenza di dominio (sapere come appare un output di qualità). La capacità di programmare rimane importante per comprendere e revisionare l'output degli agenti.

Come si relaziona l'agentic engineering all'harness engineering e al context engineering?

Il context engineering si concentra su quali informazioni il modello vede in una singola interazione. L'harness engineering si concentra sull'infrastruttura che vincola e abilita gli agenti (linter, CI, regole architettoniche). L'agentic engineering è la disciplina generale che comprende entrambe: è la metodologia completa di costruzione del software con agenti IA, inclusi i ruoli del team, la governance, i flussi di lavoro e il cambiamento organizzativo.

Agentic Engineering: La guida completa allo sviluppo software AI-First oltre il Vibe Coding

Marzo 2026 — Nel 2025, Andrej Karpathy ci ha introdotto al vibe coding: descrivere ciò che si desidera e lasciare che l'IA si occupi dell'implementazione. Era divertente, veloce e andava bene per i prototipi.

Poi le persone hanno cercato di mandare in produzione software creato con il vibe coding. I risultati non sono stati eccellenti.

All'inizio del 2026, Karpathy ha coniato un nuovo termine per ciò che viene dopo: agentic engineering — la disciplina di progettare sistemi in cui gli agenti IA pianificano, scrivono, testano e rilasciano codice sotto una supervisione umana strutturata. Non si tratta di prompting casuale. Non è un "spera e controlla". È una metodologia ingegneristica professionale costruita per lo sviluppo AI-first.

I numeri che sostengono questo cambiamento sono reali: TELUS ha risparmiato oltre 500.000 ore con 13.000 soluzioni IA. Zapier ha raggiunto l'89% di adozione dell'IA in tutta l'organizzazione. I "Minions" di Stripe producono più di 1.000 PR (Pull Request) unite a settimana. Non è teoria: è il modo in cui il software viene costruito in questo momento.

Dal Vibe Coding all'Agentic Engineering: Cosa è cambiato

Il problema del Vibe Coding

Il vibe coding funziona brillantemente per:

Prototipi e demo veloci
Script personali e strumenti una-tantum
Apprendimento ed esplorazione
Progetti per hackathon

Il vibe coding fallisce catastroficamente per:

Sistemi di produzione con requisiti di uptime
Codebase mantenute da team
Applicazioni con esigenze di sicurezza e conformità
Software che deve evolversi nel corso di mesi e anni

Questa modalità di fallimento ha un nome: AI slop — codice che sembra ragionevole in superficie ma manca di una corretta gestione degli errori, introduce vulnerabilità di sicurezza, rompe funzionalità esistenti o crea un'architettura non mantenibile. Senza una supervisione strutturata, l'IA genera codice che aumenta il debito tecnico più velocemente di quanto crei valore.

L'evoluzione

Stadio	Era	Approccio	Ruolo Umano
Coding Manuale	Ante-2023	Gli umani scrivono tutto il codice	Autore
Coding Assistito dall'IA	2023–2024	L'IA suggerisce completamenti	Autore con autocomplete
Vibe Coding	2025	L'IA genera dalle descrizioni	Scrittore di prompt
Agentic Engineering	2026	Agenti IA pianificano, scrivono, testano, rilasciano	Architetto e supervisore

L'intuizione chiave: l'agentic engineering non elimina la necessità di competenze ingegneristiche, ma le reindirizza. Invece di scrivere codice, progetti i sistemi, i vincoli e i loop di feedback che consentono all'IA di scrivere codice in modo affidabile.

Il Framework Core: Plan → Execute → Verify (PEV)

L'agentic engineering sostituisce il workflow informale "prometti e spera" con un loop strutturato:

Plan (Pianificazione)

Prima che un agente scriva una singola riga di codice:

Definire l'obiettivo — Come appare il lavoro "finito"? Quali sono i criteri di accettazione?
Scomporre in compiti — Dividere obiettivi complessi in unità di lavoro a misura di agente.
Impostare i vincoli — Confini architettonici, regole dello stack tecnologico, guide di stile.
Specificare i gate di qualità — Quali test devono passare? Quali revisioni sono necessarie?
Assegnare i ruoli agli agenti — Quale agente gestisce l'implementazione? I test? La revisione della sicurezza?

La fase di pianificazione è quella in cui la competenza ingegneristica conta di più. Un piano vago produce codice vago. Un piano preciso con vincoli chiari produce un output focalizzato e revisionabile.

Execute (Esecuzione)

Gli agenti lavorano autonomamente entro i vincoli definiti nella fase di pianificazione:

Agenti di implementazione scrivono codice seguendo le regole architettoniche.
Agenti di test generano ed eseguono suite di test.
Agenti di revisione controllano lo stile, la sicurezza e la conformità architettonica.
Agenti di documentazione aggiornano i documenti per riflettere le modifiche al codice.

Gli agenti iterano finché il loro lavoro non supera i gate di qualità. L'intervento umano è necessario solo quando gli agenti si bloccano o quando i compromessi richiedono giudizio.

Verify (Verifica)

Gli esseri umani revisionano l'output dell'agente rispetto agli obiettivi originali:

Soddisfa i criteri di accettazione?
Ha introdotto vulnerabilità di sicurezza?
L'architettura è coerente con la codebase esistente?
I test sono significativi o controllano solo i casi ideali (happy paths)?
Un ingegnere umano approverebbe questa PR?

La verifica non è un'approvazione formale superficiale. È la fase in cui il giudizio ingegneristico è più critico: stai valutando se la soluzione dell'agente non è solo funzionale, ma fatta bene.

Orchestrazione Multi-Agente: La Pratica Fondamentale

L'agentic engineering non riguarda un'unica IA che fa tutto. Riguarda agenti specializzati con ruoli definiti che lavorano insieme sotto l'orchestrazione umana.

Il Modello di Team di Agenti

Ruolo dell'Agente	Responsabilità	Esempio di Strumento
Autore Funzionalità	Scrive il codice di implementazione	Codex, Claude Code, Cursor
Generatore di Test	Crea test unitari, di integrazione ed E2E	Codex, Claude Code
Revisore del Codice	Controlla stile, pattern, sicurezza	Linter personalizzati basati su LLM
Guardiano dell'Architettura	Convalida la conformità strutturale	ArchUnit + LLM auditor
Scrittore Documentazione	Aggiorna i documenti in base alle modifiche	Codex, Claude Code
Scanner di Sicurezza	Identifica vulnerabilità	Strumenti SAST potenziati dall'IA
Release Manager	Gestisce CI/CD, controlli di distribuzione	Agenti personalizzati

Come si coordinano

In pratica, i workflow multi-agente seguono una pipeline:

Descrizione del compito (Umano)
  → Autore Funzionalità (scrive codice)
  → Generatore di Test (scrive test)
  → Revisore del Codice (revisiona modifiche)
  → Guardiano dell'Architettura (controlla conformità)
  → Scanner di Sicurezza (controllo vulnerabilità)
  → Revisione Umana (approvazione finale)
  → Pipeline CI/CD (distribuzione automatizzata)

Ogni agente produce artefatti che alimentano il successivo. L'essere umano rimane il decisore nei checkpoint chiave, ma l'esecuzione tra i checkpoint è completamente autonoma.

Risultati Reali: Cosa stanno ottenendo le aziende

TELUS: 13.000 soluzioni IA, 500.000 ore risparmiate

TELUS Digital ha distribuito l'agentic engineering in tutta l'organizzazione:

Oltre 13.000 soluzioni IA personalizzate create.
Codice ingegneristico rilasciato il 30% più velocemente.
Oltre 500.000 ore totali risparmiate.
Scalabilità estesa ai team non ingegneristici.

Zapier: 89% di adozione dell'IA in tutta l'organizzazione

L'approccio di Zapier si è concentrato sul rendere gli strumenti agentici accessibili a tutti:

89% di adozione dell'IA in tutta l'azienda.
Oltre 800 agenti distribuiti internamente.
Non ingegneri che utilizzano agenti per workflow, analisi dati e contenuti.

Stripe: Oltre 1.000 PR unite a settimana dagli agenti

Il sistema interno Minions di Stripe rappresenta l'agentic engineering maturo:

Lo sviluppatore pubblica un compito in Slack.
Il Minion scrive il codice.
Il Minion supera la CI.
Il Minion apre una PR.
L'umano revisiona e unisce.

Zero interazioni tra l'assegnazione del compito e la revisione della PR. L'harness gestisce tutto.

OpenAI: 1 milione di righe con zero codice umano

Il team Codex di OpenAI ha costruito un'applicazione di produzione con:

Oltre 1 milione di righe di codice.
Zero righe scritte manualmente.
Circa 1/10 del tempo rispetto allo sviluppo tradizionale.
Utenti interni quotidiani e alpha tester esterni.
Il prodotto viene rilasciato, distribuito, si rompe e viene riparato — tutto dagli agenti.

Rakuten: Codebase da 12,5 milioni di righe in 7 ore

Rakuten ha utilizzato Claude Code per completare una complessa implementazione vLLM su una codebase di 12,5 milioni di righe in sole 7 ore con un'accuratezza numerica del 99,9%.

Lo Skill Stack dell'Agentic Engineering

Cosa cambia

Competenza Tradizionale	Equivalente nell'Agentic Engineering
Scrivere codice	Specificare l'intento con precisione
Debugging del codice	Debugging del comportamento dell'agente
Revisione del codice	Validazione dell'output dell'agente
Testing	Progettazione della strategia di test
Architettura	Progettazione del sistema di vincoli
Documentazione	Ingegneria della conoscenza leggibile dalle macchine
Project management	Orchestrazione multi-agente

Cosa rimane uguale

Competenza di dominio — Devi ancora sapere come appare un software di qualità.
Pensiero sistemico — Capire come interagiscono i componenti è più importante, non meno.
Consapevolezza della sicurezza — Gli agenti non conoscono intrinsecamente il tuo modello di minaccia.
Lettura del codice — Leggerai più codice che mai, solo che non lo scriverai tu.

Cosa c'è di nuovo

Prompt design per agenti — Diverso dai prompt dei chatbot; i prompt degli agenti sono specifiche operative.
Harness design — Costruire i vincoli, i linter e i loop di feedback che mantengono produttivi gli agenti.
Context engineering — Assicurarsi che gli agenti abbiano le informazioni giuste al momento giusto.
Valutazione degli agenti — Misurare se i tuoi agenti stanno migliorando o regredendo.

Come iniziare con l'Agentic Engineering

Stadio 1: Workflow a Agente Singolo

Se attualmente stai facendo vibe coding, aggiungi struttura:

Scrivi una specifica prima del prompting — Definisci come appare il lavoro "finito".
Usa CLAUDE.md o .cursorrules — Codifica le tue convenzioni.
Esegui i test prima di accettare — Mai unire codice IA che non sia stato testato.
Revisiona attentamente i diff — Cerca pattern di "AI slop" (astrazioni non necessarie, gestione degli errori ridondante, API hallucinate).

Stadio 2: Pipeline Multi-Agente

Una volta presa confidenza con i workflow strutturati a agente singolo:

Aggiungi un agente di generazione test — Separa l'implementazione dal testing.
Aggiungi la validazione CI — Gate di qualità automatizzati tra l'agente e la revisione umana.
Aggiungi agenti di documentazione — Mantieni i documenti sincronizzati con le modifiche al codice.
Inizia a tracciare le metriche — Tassi di successo degli agenti, tassi di rifiuto delle revisioni, tassi di introduzione di bug.

Stadio 3: Adozione Organizzativa

Per i team che scalano l'agentic engineering:

Crea playbook interni — Documenta come gli agenti dovrebbero essere usati per diversi tipi di compiti.
Definisci politiche di governance — Cosa richiede la revisione umana? Cosa può essere unito automaticamente?
Costruisci harness condivisi — Configurazioni standardizzate che codificano le convenzioni di tutto il team.
Formazione sulla revisione dell'output degli agenti — Diversa dalla tradizionale revisione del codice; focus sui pattern strutturali e di sicurezza.
Misura l'impatto sul business — Ore risparmiate, miglioramenti della velocità, metriche di qualità.

Agentic Engineering vs. Concetti Correlati

Concetto	Focus	Ambito
Vibe Coding	Sviluppo casuale assistito dall'IA	Singolo sviluppatore, prototipi
Context Engineering	Ottimizzazione input/contesto del modello	Singola interazione
Prompt Engineering	Creazione di prompt efficaci	Singolo prompt
Harness Engineering	Infrastruttura attorno agli agenti	Progettazione del sistema di agenti
Agentic Engineering	Metodologia completa AI-first	A livello organizzativo

La relazione:

Prompt engineering → come parli al modello
Context engineering → cosa sa il modello
Harness engineering → cosa vincola il modello
Agentic engineering → come costruisci software con il modello

L'agentic engineering comprende tutti e tre, aggiungendo workflow di team, governance, cambiamento organizzativo e integrazione dei processi aziendali.

La Dimensione Sicurezza

L'Agentic Coding Report 2026 di Anthropic sottolinea che l'agentic engineering deve integrare la sicurezza fin dal primo giorno:

Gli agenti possono introdurre vulnerabilità su scala — Un agente che scrive 1.000 PR a settimana con un tasso di vulnerabilità dell'1% crea 10 nuove vulnerabilità settimanali.
Le superfici di attacco si espandono — Gli agenti che accedono ad API, database e servizi esterni creano nuovi vettori.
È richiesta una difesa automatizzata — La revisione manuale della sicurezza non può tenere il passo con il codice generato dagli agenti.
I gate di qualità devono includere la sicurezza — Ogni ciclo PEV dovrebbe includere scansioni di sicurezza automatizzate.

La stessa scalabilità che rende l'agentic engineering potente per lo sviluppo si applica anche agli attaccanti. Costruire la sicurezza nell'harness — non aggiungerla in un secondo momento — è imprescindibile.

La nostra prospettiva: Costruire prodotti potenziati dall'IA con l'Agentic Engineering

In NxCode, negli ultimi mesi siamo passati dallo sviluppo assistito dall'IA all'agentic engineering. Ecco cosa abbiamo imparato:

Cosa funziona

Specifiche strutturate prima dell'esecuzione dell'agente — I 10 minuti passati a scrivere una specifica chiara risparmiano ore di rilavorazione.
Pipeline di agenti multi-provider — Usare Claude per decisioni architettoniche complesse e Codex per compiti di implementazione ad alto volume.
Validazione CI aggressiva — La nostra CI intercetta circa il 15% del codice generato dagli agenti che avrebbe introdotto bug.
Workflow documentation-first — Aggiornare i documenti prima di scrivere il codice (tramite agenti) mantiene la base di conoscenza aggiornata per le future sessioni degli agenti.

Cosa non funziona (ancora)

Progetti multi-giorno completamente autonomi — Gli agenti hanno ancora bisogno di checkpoint umani ogni poche ore per lavori complessi.
Refactoring cross-sistema — Gli agenti gestiscono bene il refactoring di un singolo servizio, ma faticano con modifiche coordinate tra più microservizi.
Decisioni architettoniche inedite — Quando non c'è un precedente nella codebase, gli agenti ricorrono a pattern generici che potrebbero non adattarsi al contesto specifico.

In sintesi

L'agentic engineering non serve a sostituire gli sviluppatori. Serve a moltiplicare ciò che ogni sviluppatore può realizzare. I team che padroneggiano questa disciplina produrranno 5-10 volte più di quelli che scrivono ancora ogni riga a mano — non perché l'IA sia più intelligente, ma perché il processo ingegneristico è migliore.

Punti Chiave

L'agentic engineering è l'evoluzione professionale oltre il vibe coding: la supervisione strutturata sostituisce il prompting casuale.
Il loop PEV (Pianificazione → Esecuzione → Verifica) è il workflow principale che sostituisce il "prometti e spera".
L'orchestrazione multi-agente utilizza agenti specializzati (autore, tester, revisore, scanner di sicurezza) che lavorano in coordinamento.
I risultati reali sono significativi: TELUS (500k ore risparmiate), Zapier (89% di adozione), Stripe (1.000+ PR/settimana dagli agenti).
Il ruolo dell'ingegnere cambia: dal scrivere codice al progettare sistemi, specificare l'intento e validare l'output.
La sicurezza deve essere integrata fin dal primo giorno: lo sviluppo su scala agente richiede una sicurezza su scala agente.
Inizia con la struttura: scrivi specifiche, codifica convenzioni, esegui test, revisiona attentamente — poi scala.

Risorse Correlate

Guida completa all'Harness Engineering — Il livello infrastrutturale che alimenta l'agentic engineering.
L'Agentic Web spiegato: AGENTS.md, MCP vs A2A — Gli standard di protocollo per i sistemi multi-agente.
Cursor Cloud Agents: Coding autonomo su VM — L'agentic engineering in pratica con le VM cloud.
Costruisci il tuo sito web con NxCode — Sviluppo web potenziato dall'IA utilizzando i principi dell'agentic engineering.

Agentic Engineering: La guida completa allo sviluppo software AI-First oltre il Vibe Coding (2026)