Gemini 3.5 Flash Computer Use: guia de agents em produção
← Back to news

Gemini 3.5 Flash Computer Use: guia de agents em produção

N

NxCode Team

4 min read

Principais pontos

  • Gemini 3.5 Flash Computer Use é um sinal de produção. O Google colocou interação com tela dentro de um modelo Flash principal.
  • O problema real não é clicar. É política de ação, aprovação, prompt injection, auditoria e prova do que foi executado.
  • A infraestrutura converge. Google enfatiza sandbox e human-in-the-loop; Vercel eve traz durable execution, sandboxed compute, approvals, subagents e evals; Dapr 1.18 adiciona provenance verificável.

Gemini 3.5 Flash Computer Use: guia de agents em produção

O resumo fácil é que Gemini agora usa computadores. Para engenharia, a pergunta real é se podemos colocar esse agent em workflows reais com segurança.

Segundo o Google, Computer Use virou built-in tool no Gemini 3.5 Flash. Com Gemini API e Gemini Enterprise Agent Platform, desenvolvedores podem criar agents que observam, raciocinam e agem em browser, mobile e desktop. O Google também oferece demo Browserbase, implementação de referência e guardrails corporativos, como confirmação para ações sensíveis ou irreversíveis e parada automática quando indirect prompt injection é detectada.

Computer use é diferente de function calling. Function calling chama APIs explícitas como run_tests ou create_ticket. Computer use opera interfaces existentes: consoles admin, dashboards, apps legados e previews. Isso é flexível, mas aumenta risco de conteúdo não confiável, botões ambíguos e estados de UI inesperados.

Por que isso muda AI coding

Os primeiros casos são UI QA, acessibilidade, testes de regressão e formulários. O caso maior é agentic software delivery. Ferramentas de AI coding estão saindo de "escreva esta função" para "pegue esta issue, altere o repo, rode testes, abra PR e aguarde review". Quando o agent precisa usar previews, logs, backends de pagamento, consoles cloud ou trackers, computer use entra no ciclo de desenvolvimento.

Codex Remote GA aponta para a mesma direção. As release notes da OpenAI dizem que o app mobile do ChatGPT pode iniciar ou continuar trabalho do Codex em um host Mac ou Windows, revisar progresso e aprovar ações. O mobile vira painel de controle, não substituto do IDE.

Arquitetura de produção

Defina tarefas claras. "Verifique checkout em staging e reporte problemas" funciona. "Conserte o site" não. Liste domínios, contas, ambientes e condições de parada.

Isole o ambiente. Use browser controlado, VM, device farm ou sandbox. Prefira contas staging, tenants de teste, sessões curtas e dados descartáveis. Não entregue a sessão pessoal de um desenvolvedor.

Use permissões mínimas. Um agent que lê logs não precisa deploy. Um agent que cria tickets em rascunho não precisa enviar e-mail para clientes. Permissões amplas simplificam demos e ampliam incidentes.

Defina action policy. Leituras podem ser automáticas. Escritas reversíveis podem ser permitidas com logging. Ações arriscadas pedem aprovação. Ações irreversíveis devem ficar bloqueadas até evals, auditoria e rollback amadurecerem.

Guarde evidência. Screenshots, tool calls, decisões do modelo, aprovações e mudanças de estado devem ir para audit stream. Em workflows críticos, Dapr 1.18 adiciona Workflow History Signing, Propagation e Attestation. Logs contam o que aconteceu; Verifiable Execution ajuda a provar.

Gemini, eve, Dapr e Codex

Gemini 3.5 Flash Computer Use é capacidade de modelo e API. Codex Remote é superfície de controle para desenvolvedores. Vercel eve é framework e runtime de agents. Dapr 1.18 é infraestrutura de provenance verificável. Um stack sério pode precisar das quatro camadas.

Vercel eve mostra que frameworks de agents estão indo de prompt orchestration para production runtime, com durable execution, sandboxed compute, approvals, subagents e evals. Dapr responde de onde uma ação veio e se o histórico foi alterado.

Conclusão

Gemini 3.5 Flash Computer Use aproxima computer-use agents do stack normal de automação para desenvolvedores. Mas agent em produção é worker dentro do sistema. Worker precisa permissões, supervisão, auditoria e histórico executável que possa ser provado.

Sources

Back to all news
Enjoyed this article?

Construir com NxCode

Transforme sua ideia em um app funcional — sem programação.

Mais de 46.000 desenvolvedores construíram com NxCode neste mês

Construa sua ideia com IA

Descreva o que você quer — NxCode constrói para você.

Mais de 46.000 desenvolvedores construíram com NxCode neste mês