Gemini 3.5 Flash Computer Use: panduan agent produksi untuk developer
← Back to news

Gemini 3.5 Flash Computer Use: panduan agent produksi untuk developer

N

NxCode Team

3 min read

Ringkasan

  • Gemini 3.5 Flash Computer Use adalah sinyal produksi. Google membawa interaksi layar ke model Flash utama.
  • Masalah utamanya bukan klik. Masalahnya adalah policy, approval, prompt injection, audit, dan bukti eksekusi.
  • Infrastruktur agent mulai seragam. Google menekankan sandbox dan human-in-the-loop; Vercel eve membawa durable execution, sandboxed compute, approvals, subagents, evals; Dapr 1.18 menambah provenance yang dapat diverifikasi.

Gemini 3.5 Flash Computer Use: panduan agent produksi untuk developer

Judul sederhana dari pengumuman Google adalah: Gemini kini bisa menggunakan komputer. Namun bagi tim engineering, pertanyaan yang lebih penting adalah apakah agent seperti ini bisa masuk ke workflow nyata secara aman.

Google menyatakan Computer Use kini menjadi built-in tool di Gemini 3.5 Flash. Melalui Gemini API dan Gemini Enterprise Agent Platform, developer dapat membuat agent yang melihat, bernalar, dan bertindak di browser, mobile, dan desktop. Google juga menyediakan demo Browserbase, reference implementation, serta safeguard enterprise seperti konfirmasi untuk aksi sensitif atau tidak dapat dibalik dan penghentian task saat indirect prompt injection terdeteksi.

Computer use berbeda dari function calling. Function calling memanggil API eksplisit seperti run_tests atau create_ticket. Computer use memakai antarmuka yang sudah ada: admin console, dashboard, aplikasi legacy, dan preview deployment. Ini lebih fleksibel, tetapi juga lebih rentan terhadap teks tidak tepercaya, tombol ambigu, dan modal yang mengubah konteks.

Hubungannya dengan AI coding

Use case awalnya jelas: UI QA, accessibility, regression test, dan form flow. Nilai yang lebih besar ada di agentic software delivery. AI coding tool bergerak dari menulis fungsi menuju mengambil issue, mengubah repo, menjalankan test, membuka PR, dan menunggu review. Saat agent perlu memakai preview, log dashboard, payment backend, cloud console, atau issue tracker, computer use menjadi bagian dari loop development.

Codex Remote GA menunjukkan pola yang sama. Release notes OpenAI menjelaskan bahwa ChatGPT mobile app dapat memulai atau melanjutkan pekerjaan Codex di host Mac atau Windows, melihat progress, dan menyetujui aksi. Mobile bukan pengganti IDE, tetapi control plane untuk kerja agent asynchronous.

Desain produksi

Mulailah dengan task yang jelas. "Periksa checkout di staging dan laporkan masalah" jauh lebih baik daripada "perbaiki situs". Definisikan domain, akun, environment, dan stop condition.

Isolasi environment. Jalankan agent di controlled browser, VM, device farm, atau sandbox. Gunakan staging account, test tenant, short-lived session, dan data disposable. Jangan berikan sesi browser pribadi developer.

Batasi permission. Agent yang hanya membaca log tidak perlu deploy access. Agent yang membuat draft ticket tidak perlu mengirim email pelanggan. Permission luas membuat demo mudah, tetapi insiden produksi lebih besar.

Buat action policy. Read action dapat otomatis. Reversible write dapat diizinkan dengan logging. Risky action butuh approval. Irreversible action sebaiknya diblokir sampai eval, audit, dan rollback matang.

Simpan bukti. Screenshot, tool call, keputusan model, approval event, dan state change harus masuk audit stream. Untuk workflow penting, Dapr 1.18 menyediakan Workflow History Signing, Propagation, dan Attestation. Log menjelaskan apa yang terjadi; Verifiable Execution membantu membuktikannya.

Gemini, eve, Dapr, dan Codex

Gemini 3.5 Flash Computer Use adalah model capability dan API. Codex Remote adalah control surface untuk developer. Vercel eve adalah agent framework dan runtime. Dapr 1.18 adalah infrastructure untuk workflow provenance. Stack agent serius dapat memakai semuanya.

Vercel eve menarik karena memasukkan durable execution, sandboxed compute, human-in-the-loop approvals, subagents, dan evals ke framework. Ini menunjukkan kompetisi agent framework bergeser dari prompt orchestration ke production runtime. Dapr menjawab pertanyaan lain: aksi ini berasal dari workflow mana, dan apakah riwayatnya dapat dipercaya?

Kesimpulan

Gemini 3.5 Flash Computer Use membuat computer-use agent lebih dekat dengan stack otomasi developer. Namun agent produksi adalah worker di dalam sistem software. Worker butuh permission, supervisi, audit, dan riwayat eksekusi yang bisa dibuktikan.

Sources

Back to all news
Enjoyed this article?

Bangun dengan NxCode

Ubah ide Anda menjadi aplikasi yang berfungsi — tanpa coding.

46.000+ developer membangun dengan NxCode bulan ini

Bangun ide Anda dengan AI

Jelaskan yang Anda inginkan — NxCode membangunnya untuk Anda.

46.000+ developer membangun dengan NxCode bulan ini