In breve
- Gemini 3.5 Flash Computer Use è un segnale di produzione. Google porta l'interazione con lo schermo dentro un modello Flash principale.
- Il problema non è cliccare. Il problema è definire policy, approvazioni, difese da prompt injection, audit e prova dell'esecuzione.
- Lo stack degli agent converge. Google cita sandbox e human-in-the-loop; Vercel eve include durable execution, sandboxed compute, approvals, subagents, evals; Dapr 1.18 aggiunge provenance verificabile.
Gemini 3.5 Flash Computer Use: guida agli agenti in produzione
Il titolo semplice è che Gemini ora può usare un computer. Per un team di sviluppo, la domanda vera è se un agent può entrare in workflow reali senza creare rischio incontrollato.
Google afferma che Computer Use è ora un built-in tool di Gemini 3.5 Flash. Con Gemini API e Gemini Enterprise Agent Platform, gli sviluppatori possono creare agent che osservano, ragionano e agiscono in browser, mobile e desktop. Google fornisce anche demo Browserbase, reference implementation e safeguard enterprise: conferma esplicita per azioni sensibili o irreversibili e stop automatico quando viene rilevata indirect prompt injection.
Computer use non è function calling. Function calling invoca API esplicite come run_tests o create_ticket. Computer use usa interfacce esistenti: console admin, dashboard, applicazioni legacy e preview deployment. È più flessibile, ma esposto a contenuti non affidabili, pulsanti ambigui e stati UI inattesi.
Perché conta per AI coding
I primi usi sono UI QA, accessibilità, regression test e form flow. Il trend più ampio è agentic software delivery. Gli strumenti di AI coding stanno passando da "scrivi questa funzione" a "prendi questa issue, modifica il repo, esegui test, apri una PR e attendi review". Quando un agent deve usare preview, log, backend di pagamento, console cloud o issue tracker, computer use diventa parte del ciclo di sviluppo.
Codex Remote GA mostra la stessa direzione. Le release notes di OpenAI dicono che l'app mobile ChatGPT può avviare o continuare lavoro Codex su host Mac o Windows, rivedere il progresso e approvare azioni. Il mobile diventa un pannello di controllo, non un sostituto dell'IDE.
Disegno di produzione
Definisci task precisi. "Controlla il checkout in staging e segnala problemi" funziona. "Sistema il sito" no. Indica domini, account, ambienti e condizioni di stop.
Isola l'ambiente. Esegui l'agent in browser controllato, VM, device farm o sandbox. Usa account staging, tenant di test, sessioni brevi e dati eliminabili. Non consegnare la sessione personale di uno sviluppatore.
Riduci i permessi. Un agent che legge log non deve poter fare deploy. Un agent che crea draft ticket non deve inviare email ai clienti. Permessi larghi rendono facili le demo e gravi gli incidenti.
Definisci action policy. Le letture possono essere automatiche. Le scritture reversibili possono essere permesse con logging. Le azioni rischiose richiedono approvazione. Quelle irreversibili vanno bloccate finché eval, audit e rollback non sono maturi.
Registra evidenza. Screenshot, tool call, decisioni del modello, approvazioni e state change devono finire in un audit stream. Dapr 1.18 aggiunge Workflow History Signing, Propagation e Attestation. I log raccontano cosa è successo; Verifiable Execution aiuta a provarlo.
Gemini, eve, Dapr e Codex
Gemini 3.5 Flash Computer Use è capacità modello e API. Codex Remote è superficie di controllo per sviluppatori. Vercel eve è framework e runtime per agent. Dapr 1.18 è infrastruttura di provenance verificabile. Uno stack serio può richiedere tutti e quattro.
Vercel eve mostra che i framework per agent stanno passando da prompt orchestration a production runtime. Dapr risponde a un'altra domanda: da quale workflow è arrivata questa azione e la storia è stata alterata?
Conclusione
Gemini 3.5 Flash Computer Use avvicina i computer-use agent allo stack normale di automazione per sviluppatori. Ma un agent in produzione è un worker nel sistema software. Ha bisogno di permessi, supervisione, audit e cronologia eseguibile verificabile.
Sources
- Google: Introducing computer use in Gemini 3.5 Flash
- Vercel: Introducing eve
- CNCF: Introducing Verifiable Execution in Dapr 1.18
- OpenAI Help Center: ChatGPT release notes