Agentic Engineering: La guida completa allo sviluppo software AI-First oltre il Vibe Coding
Marzo 2026 — Nel 2025, Andrej Karpathy ci ha introdotto al vibe coding: descrivere ciò che si desidera e lasciare che l'IA si occupi dell'implementazione. Era divertente, veloce e andava bene per i prototipi.
Poi le persone hanno cercato di mandare in produzione software creato con il vibe coding. I risultati non sono stati eccellenti.
All'inizio del 2026, Karpathy ha coniato un nuovo termine per ciò che viene dopo: agentic engineering — la disciplina di progettare sistemi in cui gli agenti IA pianificano, scrivono, testano e rilasciano codice sotto una supervisione umana strutturata. Non si tratta di prompting casuale. Non è un "spera e controlla". È una metodologia ingegneristica professionale costruita per lo sviluppo AI-first.
I numeri che sostengono questo cambiamento sono reali: TELUS ha risparmiato oltre 500.000 ore con 13.000 soluzioni IA. Zapier ha raggiunto l'89% di adozione dell'IA in tutta l'organizzazione. I "Minions" di Stripe producono più di 1.000 PR (Pull Request) unite a settimana. Non è teoria: è il modo in cui il software viene costruito in questo momento.
Dal Vibe Coding all'Agentic Engineering: Cosa è cambiato
Il problema del Vibe Coding
Il vibe coding funziona brillantemente per:
- Prototipi e demo veloci
- Script personali e strumenti una-tantum
- Apprendimento ed esplorazione
- Progetti per hackathon
Il vibe coding fallisce catastroficamente per:
- Sistemi di produzione con requisiti di uptime
- Codebase mantenute da team
- Applicazioni con esigenze di sicurezza e conformità
- Software che deve evolversi nel corso di mesi e anni
Questa modalità di fallimento ha un nome: AI slop — codice che sembra ragionevole in superficie ma manca di una corretta gestione degli errori, introduce vulnerabilità di sicurezza, rompe funzionalità esistenti o crea un'architettura non mantenibile. Senza una supervisione strutturata, l'IA genera codice che aumenta il debito tecnico più velocemente di quanto crei valore.
L'evoluzione
| Stadio | Era | Approccio | Ruolo Umano |
|---|---|---|---|
| Coding Manuale | Ante-2023 | Gli umani scrivono tutto il codice | Autore |
| Coding Assistito dall'IA | 2023–2024 | L'IA suggerisce completamenti | Autore con autocomplete |
| Vibe Coding | 2025 | L'IA genera dalle descrizioni | Scrittore di prompt |
| Agentic Engineering | 2026 | Agenti IA pianificano, scrivono, testano, rilasciano | Architetto e supervisore |
L'intuizione chiave: l'agentic engineering non elimina la necessità di competenze ingegneristiche, ma le reindirizza. Invece di scrivere codice, progetti i sistemi, i vincoli e i loop di feedback che consentono all'IA di scrivere codice in modo affidabile.
Il Framework Core: Plan → Execute → Verify (PEV)
L'agentic engineering sostituisce il workflow informale "prometti e spera" con un loop strutturato:
Plan (Pianificazione)
Prima che un agente scriva una singola riga di codice:
- Definire l'obiettivo — Come appare il lavoro "finito"? Quali sono i criteri di accettazione?
- Scomporre in compiti — Dividere obiettivi complessi in unità di lavoro a misura di agente.
- Impostare i vincoli — Confini architettonici, regole dello stack tecnologico, guide di stile.
- Specificare i gate di qualità — Quali test devono passare? Quali revisioni sono necessarie?
- Assegnare i ruoli agli agenti — Quale agente gestisce l'implementazione? I test? La revisione della sicurezza?
La fase di pianificazione è quella in cui la competenza ingegneristica conta di più. Un piano vago produce codice vago. Un piano preciso con vincoli chiari produce un output focalizzato e revisionabile.
Execute (Esecuzione)
Gli agenti lavorano autonomamente entro i vincoli definiti nella fase di pianificazione:
- Agenti di implementazione scrivono codice seguendo le regole architettoniche.
- Agenti di test generano ed eseguono suite di test.
- Agenti di revisione controllano lo stile, la sicurezza e la conformità architettonica.
- Agenti di documentazione aggiornano i documenti per riflettere le modifiche al codice.
Gli agenti iterano finché il loro lavoro non supera i gate di qualità. L'intervento umano è necessario solo quando gli agenti si bloccano o quando i compromessi richiedono giudizio.
Verify (Verifica)
Gli esseri umani revisionano l'output dell'agente rispetto agli obiettivi originali:
- Soddisfa i criteri di accettazione?
- Ha introdotto vulnerabilità di sicurezza?
- L'architettura è coerente con la codebase esistente?
- I test sono significativi o controllano solo i casi ideali (happy paths)?
- Un ingegnere umano approverebbe questa PR?
La verifica non è un'approvazione formale superficiale. È la fase in cui il giudizio ingegneristico è più critico: stai valutando se la soluzione dell'agente non è solo funzionale, ma fatta bene.
Orchestrazione Multi-Agente: La Pratica Fondamentale
L'agentic engineering non riguarda un'unica IA che fa tutto. Riguarda agenti specializzati con ruoli definiti che lavorano insieme sotto l'orchestrazione umana.
Il Modello di Team di Agenti
| Ruolo dell'Agente | Responsabilità | Esempio di Strumento |
|---|---|---|
| Autore Funzionalità | Scrive il codice di implementazione | Codex, Claude Code, Cursor |
| Generatore di Test | Crea test unitari, di integrazione ed E2E | Codex, Claude Code |
| Revisore del Codice | Controlla stile, pattern, sicurezza | Linter personalizzati basati su LLM |
| Guardiano dell'Architettura | Convalida la conformità strutturale | ArchUnit + LLM auditor |
| Scrittore Documentazione | Aggiorna i documenti in base alle modifiche | Codex, Claude Code |
| Scanner di Sicurezza | Identifica vulnerabilità | Strumenti SAST potenziati dall'IA |
| Release Manager | Gestisce CI/CD, controlli di distribuzione | Agenti personalizzati |
Come si coordinano
In pratica, i workflow multi-agente seguono una pipeline:
Descrizione del compito (Umano)
→ Autore Funzionalità (scrive codice)
→ Generatore di Test (scrive test)
→ Revisore del Codice (revisiona modifiche)
→ Guardiano dell'Architettura (controlla conformità)
→ Scanner di Sicurezza (controllo vulnerabilità)
→ Revisione Umana (approvazione finale)
→ Pipeline CI/CD (distribuzione automatizzata)
Ogni agente produce artefatti che alimentano il successivo. L'essere umano rimane il decisore nei checkpoint chiave, ma l'esecuzione tra i checkpoint è completamente autonoma.
Risultati Reali: Cosa stanno ottenendo le aziende
TELUS: 13.000 soluzioni IA, 500.000 ore risparmiate
TELUS Digital ha distribuito l'agentic engineering in tutta l'organizzazione:
- Oltre 13.000 soluzioni IA personalizzate create.
- Codice ingegneristico rilasciato il 30% più velocemente.
- Oltre 500.000 ore totali risparmiate.
- Scalabilità estesa ai team non ingegneristici.
Zapier: 89% di adozione dell'IA in tutta l'organizzazione
L'approccio di Zapier si è concentrato sul rendere gli strumenti agentici accessibili a tutti:
- 89% di adozione dell'IA in tutta l'azienda.
- Oltre 800 agenti distribuiti internamente.
- Non ingegneri che utilizzano agenti per workflow, analisi dati e contenuti.
Stripe: Oltre 1.000 PR unite a settimana dagli agenti
Il sistema interno Minions di Stripe rappresenta l'agentic engineering maturo:
- Lo sviluppatore pubblica un compito in Slack.
- Il Minion scrive il codice.
- Il Minion supera la CI.
- Il Minion apre una PR.
- L'umano revisiona e unisce.
Zero interazioni tra l'assegnazione del compito e la revisione della PR. L'harness gestisce tutto.
OpenAI: 1 milione di righe con zero codice umano
Il team Codex di OpenAI ha costruito un'applicazione di produzione con:
- Oltre 1 milione di righe di codice.
- Zero righe scritte manualmente.
- Circa 1/10 del tempo rispetto allo sviluppo tradizionale.
- Utenti interni quotidiani e alpha tester esterni.
- Il prodotto viene rilasciato, distribuito, si rompe e viene riparato — tutto dagli agenti.
Rakuten: Codebase da 12,5 milioni di righe in 7 ore
Rakuten ha utilizzato Claude Code per completare una complessa implementazione vLLM su una codebase di 12,5 milioni di righe in sole 7 ore con un'accuratezza numerica del 99,9%.
Lo Skill Stack dell'Agentic Engineering
Cosa cambia
| Competenza Tradizionale | Equivalente nell'Agentic Engineering |
|---|---|
| Scrivere codice | Specificare l'intento con precisione |
| Debugging del codice | Debugging del comportamento dell'agente |
| Revisione del codice | Validazione dell'output dell'agente |
| Testing | Progettazione della strategia di test |
| Architettura | Progettazione del sistema di vincoli |
| Documentazione | Ingegneria della conoscenza leggibile dalle macchine |
| Project management | Orchestrazione multi-agente |
Cosa rimane uguale
- Competenza di dominio — Devi ancora sapere come appare un software di qualità.
- Pensiero sistemico — Capire come interagiscono i componenti è più importante, non meno.
- Consapevolezza della sicurezza — Gli agenti non conoscono intrinsecamente il tuo modello di minaccia.
- Lettura del codice — Leggerai più codice che mai, solo che non lo scriverai tu.
Cosa c'è di nuovo
- Prompt design per agenti — Diverso dai prompt dei chatbot; i prompt degli agenti sono specifiche operative.
- Harness design — Costruire i vincoli, i linter e i loop di feedback che mantengono produttivi gli agenti.
- Context engineering — Assicurarsi che gli agenti abbiano le informazioni giuste al momento giusto.
- Valutazione degli agenti — Misurare se i tuoi agenti stanno migliorando o regredendo.
Come iniziare con l'Agentic Engineering
Stadio 1: Workflow a Agente Singolo
Se attualmente stai facendo vibe coding, aggiungi struttura:
- Scrivi una specifica prima del prompting — Definisci come appare il lavoro "finito".
- Usa CLAUDE.md o .cursorrules — Codifica le tue convenzioni.
- Esegui i test prima di accettare — Mai unire codice IA che non sia stato testato.
- Revisiona attentamente i diff — Cerca pattern di "AI slop" (astrazioni non necessarie, gestione degli errori ridondante, API hallucinate).
Stadio 2: Pipeline Multi-Agente
Una volta presa confidenza con i workflow strutturati a agente singolo:
- Aggiungi un agente di generazione test — Separa l'implementazione dal testing.
- Aggiungi la validazione CI — Gate di qualità automatizzati tra l'agente e la revisione umana.
- Aggiungi agenti di documentazione — Mantieni i documenti sincronizzati con le modifiche al codice.
- Inizia a tracciare le metriche — Tassi di successo degli agenti, tassi di rifiuto delle revisioni, tassi di introduzione di bug.
Stadio 3: Adozione Organizzativa
Per i team che scalano l'agentic engineering:
- Crea playbook interni — Documenta come gli agenti dovrebbero essere usati per diversi tipi di compiti.
- Definisci politiche di governance — Cosa richiede la revisione umana? Cosa può essere unito automaticamente?
- Costruisci harness condivisi — Configurazioni standardizzate che codificano le convenzioni di tutto il team.
- Formazione sulla revisione dell'output degli agenti — Diversa dalla tradizionale revisione del codice; focus sui pattern strutturali e di sicurezza.
- Misura l'impatto sul business — Ore risparmiate, miglioramenti della velocità, metriche di qualità.
Agentic Engineering vs. Concetti Correlati
| Concetto | Focus | Ambito |
|---|---|---|
| Vibe Coding | Sviluppo casuale assistito dall'IA | Singolo sviluppatore, prototipi |
| Context Engineering | Ottimizzazione input/contesto del modello | Singola interazione |
| Prompt Engineering | Creazione di prompt efficaci | Singolo prompt |
| Harness Engineering | Infrastruttura attorno agli agenti | Progettazione del sistema di agenti |
| Agentic Engineering | Metodologia completa AI-first | A livello organizzativo |
La relazione:
- Prompt engineering → come parli al modello
- Context engineering → cosa sa il modello
- Harness engineering → cosa vincola il modello
- Agentic engineering → come costruisci software con il modello
L'agentic engineering comprende tutti e tre, aggiungendo workflow di team, governance, cambiamento organizzativo e integrazione dei processi aziendali.
La Dimensione Sicurezza
L'Agentic Coding Report 2026 di Anthropic sottolinea che l'agentic engineering deve integrare la sicurezza fin dal primo giorno:
- Gli agenti possono introdurre vulnerabilità su scala — Un agente che scrive 1.000 PR a settimana con un tasso di vulnerabilità dell'1% crea 10 nuove vulnerabilità settimanali.
- Le superfici di attacco si espandono — Gli agenti che accedono ad API, database e servizi esterni creano nuovi vettori.
- È richiesta una difesa automatizzata — La revisione manuale della sicurezza non può tenere il passo con il codice generato dagli agenti.
- I gate di qualità devono includere la sicurezza — Ogni ciclo PEV dovrebbe includere scansioni di sicurezza automatizzate.
La stessa scalabilità che rende l'agentic engineering potente per lo sviluppo si applica anche agli attaccanti. Costruire la sicurezza nell'harness — non aggiungerla in un secondo momento — è imprescindibile.
La nostra prospettiva: Costruire prodotti potenziati dall'IA con l'Agentic Engineering
In NxCode, negli ultimi mesi siamo passati dallo sviluppo assistito dall'IA all'agentic engineering. Ecco cosa abbiamo imparato:
Cosa funziona
- Specifiche strutturate prima dell'esecuzione dell'agente — I 10 minuti passati a scrivere una specifica chiara risparmiano ore di rilavorazione.
- Pipeline di agenti multi-provider — Usare Claude per decisioni architettoniche complesse e Codex per compiti di implementazione ad alto volume.
- Validazione CI aggressiva — La nostra CI intercetta circa il 15% del codice generato dagli agenti che avrebbe introdotto bug.
- Workflow documentation-first — Aggiornare i documenti prima di scrivere il codice (tramite agenti) mantiene la base di conoscenza aggiornata per le future sessioni degli agenti.
Cosa non funziona (ancora)
- Progetti multi-giorno completamente autonomi — Gli agenti hanno ancora bisogno di checkpoint umani ogni poche ore per lavori complessi.
- Refactoring cross-sistema — Gli agenti gestiscono bene il refactoring di un singolo servizio, ma faticano con modifiche coordinate tra più microservizi.
- Decisioni architettoniche inedite — Quando non c'è un precedente nella codebase, gli agenti ricorrono a pattern generici che potrebbero non adattarsi al contesto specifico.
In sintesi
L'agentic engineering non serve a sostituire gli sviluppatori. Serve a moltiplicare ciò che ogni sviluppatore può realizzare. I team che padroneggiano questa disciplina produrranno 5-10 volte più di quelli che scrivono ancora ogni riga a mano — non perché l'IA sia più intelligente, ma perché il processo ingegneristico è migliore.
Punti Chiave
- L'agentic engineering è l'evoluzione professionale oltre il vibe coding: la supervisione strutturata sostituisce il prompting casuale.
- Il loop PEV (Pianificazione → Esecuzione → Verifica) è il workflow principale che sostituisce il "prometti e spera".
- L'orchestrazione multi-agente utilizza agenti specializzati (autore, tester, revisore, scanner di sicurezza) che lavorano in coordinamento.
- I risultati reali sono significativi: TELUS (500k ore risparmiate), Zapier (89% di adozione), Stripe (1.000+ PR/settimana dagli agenti).
- Il ruolo dell'ingegnere cambia: dal scrivere codice al progettare sistemi, specificare l'intento e validare l'output.
- La sicurezza deve essere integrata fin dal primo giorno: lo sviluppo su scala agente richiede una sicurezza su scala agente.
- Inizia con la struttura: scrivi specifiche, codifica convenzioni, esegui test, revisiona attentamente — poi scala.
Risorse Correlate
- Guida completa all'Harness Engineering — Il livello infrastrutturale che alimenta l'agentic engineering.
- L'Agentic Web spiegato: AGENTS.md, MCP vs A2A — Gli standard di protocollo per i sistemi multi-agente.
- Cursor Cloud Agents: Coding autonomo su VM — L'agentic engineering in pratica con le VM cloud.
- Costruisci il tuo sito web con NxCode — Sviluppo web potenziato dall'IA utilizzando i principi dell'agentic engineering.


