Cursor Cloud Agents: Pengodean Otonom pada Virtual Machine yang Melakukan Pengujian Mandiri, Merekam Demo, dan Mengirimkan PR
← Back to news

Cursor Cloud Agents: Pengodean Otonom pada Virtual Machine yang Melakukan Pengujian Mandiri, Merekam Demo, dan Mengirimkan PR

N

NxCode Team

6 min read

Cursor Cloud Agents: Pengodean Otonom pada Virtual Machine yang Melakukan Pengujian Mandiri, Merekam Demo, dan Mengirimkan PR

Pada 24 Februari 2026, Cursor meluncurkan fitur yang mengubah AI coding dari sekadar "copilot" menjadi "rekan kerja": Cloud Agents — agen pengodean AI yang sepenuhnya otonom yang berjalan pada virtual machine terisolasi yang dapat membangun perangkat lunak, mengujinya sendiri, merekam demo video dari pekerjaannya, dan menghasilkan pull request yang siap digabungkan.

Ini bukan sekadar pelengkapan otomatis (autocomplete). Ini bahkan bukan sekadar pair programming. Ini adalah delegasi rekayasa — Anda menjelaskan apa yang Anda inginkan, dan AI akan pergi dan melakukannya di komputernya sendiri sementara Anda mengerjakan hal lain.

30% dari pull request yang digabungkan milik Cursor sendiri kini dibuat oleh agen-agen ini. Angka tersebut menjelaskan segalanya tentang ke mana arah pengembangan perangkat lunak.


Apa yang Sebenarnya Dilakukan Cloud Agents

Konsep Inti

Setiap Cloud Agent mendapatkan:

  1. VM terisolasi miliknya sendiri dengan lingkungan pengembangan yang lengkap
  2. Basis kode (codebase) Anda — agen melakukan onboarding mandiri dengan membaca repo Anda
  3. Tugas — dijelaskan dalam bahasa alami
  4. Otonomi — agen bekerja secara mandiri hingga selesai
  5. Pengujian mandiri — agen membangun dan menggunakan perangkat lunak yang dibuatnya
  6. Bukti — video, tangkapan layar, dan log yang dilampirkan pada PR

Setelah selesai, Anda mendapatkan PR yang siap digabungkan dengan artefak yang membuktikan bahwa perubahan tersebut berhasil. Tinjau, gabungkan, kirim.

Apa Arti "Pengujian Mandiri" dalam Praktiknya

Inilah detail yang membedakan Cloud Agents dari yang lainnya. Agen tidak hanya menulis kode dan berharap kode itu berfungsi. Agen tersebut:

  • Menjalankan aplikasi di VM-nya
  • Menavigasi UI seperti halnya pengguna
  • Memverifikasi perubahan secara visual dan fungsional
  • Merekam video dirinya saat menggunakan perangkat lunak tersebut
  • Mengambil tangkapan layar dari status-status penting
  • Mengambil log untuk debugging

Saat Anda meninjau PR, Anda tidak membaca kode secara buta. Anda menonton video agen yang mendemonstrasikan bahwa fitur tersebut berfungsi. Hal itu mengubah alur kerja peninjauan secara mendasar — Anda dapat memvalidasi perubahan UI dalam hitungan detik daripada harus menarik branch dan menjalankannya secara lokal.


Cara Menggunakan Cloud Agents

Dari Cursor (Desktop/Web)

  1. Buka proyek apa pun di Cursor
  2. Jelaskan tugas yang ingin Anda selesaikan
  3. Pilih "Run as Cloud Agent"
  4. Agen akan masuk ke basis kode Anda, membuat VM-nya, dan mulai bekerja
  5. Anda mendapatkan notifikasi seiring kemajuannya
  6. Setelah selesai, tinjau PR dengan artefak yang dilampirkan

Dari Slack

Di sinilah hal menarik untuk alur kerja tim:

  1. Tag agen Cursor di saluran Slack dengan tugas dalam bahasa alami
  2. Agen akan mengambilnya, membuat sesi cloud, dan mulai bekerja
  3. Agen membalas di utas Slack dengan ringkasan pekerjaan yang telah selesai
  4. PR siap untuk ditinjau di GitHub

Dari GitHub

Picu agen secara langsung dari issue atau komentar GitHub. Agen membaca issue, membuat branch, mengerjakannya, dan membuka PR — semuanya tanpa ada orang yang membuka IDE.

Dari Seluler

Sama seperti desktop — jelaskan tugas, pantau kemajuan, tinjau artefak setelah selesai.


Contoh Penggunaan di Dunia Nyata yang Didemonstrasikan Cursor

1. Implementasi Fitur dengan Pengujian

Tugas: "Tambahkan toggle mode gelap ke halaman pengaturan."

Agen tersebut:

  • Membaca basis kode untuk memahami sistem desain
  • Mengimplementasikan komponen toggle
  • Menambahkan variabel CSS mode gelap
  • Menulis unit test
  • Menjalankan aplikasi, menyalakan/mematikan mode gelap
  • Merekam video yang menunjukkan toggle berfungsi
  • Membuka PR dengan semua artefak

2. Perbaikan Kerentanan Keamanan

Tugas: "Reproduksi dan perbaiki kerentanan XSS di bagian komentar."

Agen tersebut:

  • Membaca laporan kerentanan
  • Mereproduksi eksploitasi dalam sandbox-nya
  • Mengimplementasikan sanitasi input
  • Memverifikasi perbaikan dengan menguji ulang eksploitasi
  • Mendokumentasikan perbaikan dengan tangkapan layar sebelum/sesudah

3. Walkthrough Situs Dokumentasi

Agen menghabiskan waktu 45 menit secara otonom menavigasi situs dokumentasi, mengidentifikasi tautan yang rusak, memperbaiki masalah pemformatan, dan memperbarui contoh kode yang sudah usang — lengkap dengan rekaman video walkthrough secara penuh.


Angka-angka: Apa yang Terjadi di Cursor

MetrikNilai
PR dari Cloud Agents30% dari PR yang digabungkan di Cursor
Valuasi$29,3 miliar
Pendapatan Tahunan$1 miliar+ (per November 2025)
Agen paralel per pengguna10–20 secara bersamaan
PlatformDesktop, Web, Seluler, Slack, GitHub

Alexi Robbins, co-head engineering untuk agen asinkron di Cursor:

"Alih-alih hanya memiliki satu hingga tiga hal yang Anda lakukan sekaligus yang berjalan pada saat yang sama, Anda dapat menjalankan 10 atau 20 hal ini secara bersamaan."


Cloud Agents vs. Claude Code vs. GitHub Copilot: Perbandingan Jujur

Kami telah menggunakan ketiganya secara ekstensif. Berikut adalah penilaian jujur kami:

KemampuanCursor Cloud AgentsClaude Code + Remote ControlGitHub Copilot
Tempat kode berjalanCloud VMMesin lokal AndaCloud
Paralelisme10–20 agenSatu sesi (beberapa via Remote Control)Satu ruang kerja
Pengujian mandiriYa, dengan bukti videoTidak (menjalankan tes tapi tanpa verifikasi visual)Tidak
Artefak PRVideo, tangkapan layar, logDiff dan percakapanDiff
Kedalaman penalaranBaikLuar Biasa (kekuatan Claude)Baik
Integrasi SlackYaTidakTerbatas
Integrasi GitHubYaMelalui MCPNative
Kode tetap lokalTidak (cloud VM)YaTidak
Akses selulerYaYa (Remote Control)Hanya Web

Kapan Menggunakan yang Mana

Gunakan Cursor Cloud Agents saat:

  • Anda memiliki banyak tugas independen untuk diparalelkan
  • Anda menginginkan bukti visual bahwa perubahan berfungsi (artefak video)
  • Tim Anda bekerja secara intensif di Slack/GitHub
  • Anda merasa nyaman dengan kode yang berjalan di VM cloud

Gunakan Claude Code saat:

  • Anda membutuhkan penalaran yang dalam dan kompleks atas basis kode yang besar
  • Anda ingin kode tetap berada di mesin lokal Anda (keamanan/kepatuhan)
  • Anda sedang melakukan satu tugas terfokus yang memerlukan iterasi bolak-balik
  • Anda membutuhkan integrasi server MCP dengan alat lokal

Gunakan keduanya saat:

  • Cursor Cloud Agents untuk tugas bervolume tinggi dan terdefinisi dengan baik (10 perbaikan bug sekaligus)
  • Claude Code untuk satu refactor arsitektur kompleks yang membutuhkan perhatian cermat

Apa Artinya bagi Tim Pengembangan

Visi "Self-Driving Codebase"

Visi jangka panjang Cursor sangat jelas: agen mengelola penggabungan PR, peluncuran (rollout), dan pemantauan produksi — apa yang mereka sebut sebagai "self-driving codebases." Cloud Agents adalah langkah nyata pertama menuju visi tersebut.

Matematika Produktivitas

Jika satu pengembang dapat mengarahkan 10–20 agen paralel:

  • Kecepatan fitur (feature velocity) berlipat ganda secara signifikan
  • Peninjauan kode (code review) menjadi penghambat (itulah sebabnya artefak video penting)
  • Tugas yang terdefinisi (perbaikan bug, penambahan fitur, penulisan tes) didelegasikan ke agen
  • Pekerjaan kreatif/arsitektural tetap dilakukan oleh manusia

Pertanyaan tentang Kualitas

30% dari PR Cursor sendiri berasal dari agen. Itu berarti Cursor cukup mempercayai agen-agen ini untuk menggabungkan kode mereka ke dalam produk yang digunakan oleh jutaan orang. Namun, Cursor juga memiliki CI/CD yang kuat, budaya peninjauan kode, dan rangkaian pengujian. Agen bekerja di dalam proses rekayasa, bukan di luarnya.

Bagi tim tanpa praktik peninjauan yang kuat, agen otonom dapat memperkenalkan masalah lebih cepat daripada menyelesaikannya. Cloud Agents memperkuat budaya rekayasa Anda, apa pun bentuknya.


Tips Praktis dari Pengujian Kami

  1. Tulis deskripsi tugas yang jelas dan spesifik — "Perbaiki tombol login" terlalu samar. "Tombol login di /auth/signin tidak memicu validasi formulir di Safari seluler" jauh lebih baik.

  2. Siapkan CI yang baik terlebih dahulu — Cloud Agents menghasilkan PR, tetapi pipeline CI Anda yang memvalidasinya. Jika pengujian Anda tidak stabil (flaky), Anda akan membuang waktu meninjau kegagalan palsu.

  3. Gunakan untuk tugas yang terdefinisi dengan baik, bukan pekerjaan eksploratif — "Tambahkan paginasi ke API daftar pengguna" berfungsi dengan baik. "Cari tahu mengapa aplikasi terasa lambat" tidak.

  4. Tinjau artefak video — Artefak tersebut ada karena suatu alasan. Peninjauan video selama 30 detik dapat menangkap regresi visual yang mungkin terlewatkan oleh peninjauan kode.

  5. Mulai dengan satu agen — Kenali alur kerjanya sebelum menskalakan ke 10. Meninjau 10 PR secara bersamaan membutuhkan disiplin.


Poin-Poin Penting

  1. Cloud Agents berjalan di VM terisolasi — masing-masing mendapatkan lingkungan pengembangan penuhnya sendiri
  2. Pengujian mandiri dengan bukti video adalah fitur unggulan — agen membuktikan bahwa kode mereka berfungsi
  3. 30% dari PR Cursor berasal dari agen — ini bukan sekadar teori
  4. 10–20 agen paralel per pengguna — peningkatan throughput yang luar biasa
  5. Tersedia dari Desktop, Web, Seluler, Slack, dan GitHub — menemui pengembang di mana pun mereka berada
  6. Valuasi Cursor sebesar $29,3 miliar mencerminkan keyakinan pasar terhadap pengodean otonom
  7. Terbaik untuk tugas yang terdefinisi dan dapat diparalelkan — bukan pengganti penilaian manusia pada arsitektur

Sumber Daya Terkait

Back to all news
Enjoyed this article?

Bangun dengan NxCode

Ubah ide Anda menjadi aplikasi yang berfungsi — tanpa coding.

46.000+ developer membangun dengan NxCode bulan ini

Coba sendiri

Jelaskan yang Anda inginkan — NxCode membangunnya untuk Anda.

46.000+ developer membangun dengan NxCode bulan ini