Agentic Engineering: Panduan Lengkap Pengembangan Perangkat Lunak AI-First Melampaui Vibe Coding (2026)
← Back to news

Agentic Engineering: Panduan Lengkap Pengembangan Perangkat Lunak AI-First Melampaui Vibe Coding (2026)

N

NxCode Team

9 min read

Agentic Engineering: Panduan Lengkap Pengembangan Perangkat Lunak AI-First Melampaui Vibe Coding

Maret 2026 — Pada tahun 2025, Andrej Karpathy memperkenalkan kita pada vibe coding — mendeskripsikan apa yang Anda inginkan dan membiarkan AI memikirkan implementasinya. Itu menyenangkan, cepat, dan cocok untuk prototipe.

Kemudian orang-orang mencoba merilis perangkat lunak hasil vibe-coding ke tahap produksi. Hasilnya tidak terlalu bagus.

Pada awal 2026, Karpathy mencetuskan istilah baru untuk tahap selanjutnya: agentic engineering — disiplin merancang sistem di mana agen AI merencanakan, menulis, menguji, dan mengirimkan kode di bawah pengawasan manusia yang terstruktur. Bukan sekadar prompt santai. Bukan asal coba-dan-periksa. Ini adalah metodologi rekayasa profesional yang dibangun untuk pengembangan AI-first.

Angka-angka yang mendukung pergeseran ini nyata: TELUS menghemat 500.000+ jam dengan 13.000 solusi AI. Zapier mencapai 89% adopsi AI di seluruh organisasi mereka. Minions milik Stripe menghasilkan 1.000+ PR yang digabungkan per minggu. Ini bukan teori — ini adalah cara perangkat lunak dibangun saat ini.


Dari Vibe Coding ke Agentic Engineering: Apa yang Berubah

Masalah dengan Vibe Coding

Vibe coding bekerja dengan sangat baik untuk:

  • Prototipe dan demo cepat
  • Skrip pribadi dan alat sekali pakai
  • Pembelajaran dan eksplorasi
  • Proyek hackathon

Vibe coding gagal total untuk:

  • Sistem produksi dengan persyaratan uptime
  • Basis kode yang dikelola oleh tim
  • Aplikasi dengan kebutuhan keamanan dan kepatuhan
  • Perangkat lunak yang perlu berkembang selama berbulan-bulan dan bertahun-tahun

Mode kegagalan ini memiliki nama: AI slop — kode yang terlihat masuk akal di permukaan tetapi kurang dalam penanganan kesalahan yang tepat, memperkenalkan kerentanan keamanan, merusak fungsionalitas yang ada, atau menciptakan arsitektur yang tidak dapat dipelihara. Tanpa pengawasan terstruktur, AI menghasilkan kode yang meningkatkan hutang teknis lebih cepat daripada menciptakan nilai.

Evolusi

TahapEraPendekatanPeran Manusia
Manual CodingPra-2023Manusia menulis semua kodePenulis
AI-Assisted Coding2023–2024AI menyarankan pelengkapanPenulis dengan autocomplete
Vibe Coding2025AI menghasilkan dari deskripsiPenulis prompt
Agentic Engineering2026Agen AI merencanakan, menulis, menguji secara otonomArsitek dan pengawas

Wawasan utamanya: agentic engineering tidak menghilangkan kebutuhan akan keterampilan rekayasa — ia mengalihkannya. Alih-alih menulis kode, Anda merancang sistem, batasan, dan loop umpan balik yang memungkinkan AI menulis kode dengan andal.


Kerangka Kerja Inti: Plan → Execute → Verify (PEV)

Agentic engineering menggantikan alur kerja informal "prompt and hope" dengan loop terstruktur:

Plan (Rencana)

Sebelum agen menulis satu baris kode pun:

  1. Tentukan tujuan — Seperti apa hasil yang "selesai"? Apa kriteria penerimaannya?
  2. Dekomposisi menjadi tugas — Pecah tujuan kompleks menjadi unit kerja seukuran agen
  3. Tetapkan batasan — Batas arsitektur, aturan tumpukan teknologi, panduan gaya
  4. Tentukan gate kualitas — Pengujian apa yang harus lulus? Tinjauan apa yang diperlukan?
  5. Tetapkan peran agen — Agen mana yang menangani implementasi? Pengujian? Tinjauan keamanan?

Fase perencanaan adalah tempat di mana keahlian teknik paling penting. Rencana yang samar menghasilkan kode yang samar. Rencana yang presisi dengan batasan yang jelas menghasilkan output yang fokus dan dapat ditinjau.

Execute (Eksekusi)

Agen bekerja secara otonom dalam batasan yang ditentukan dalam fase perencanaan:

  • Agen implementasi menulis kode mengikuti aturan arsitektur
  • Agen pengujian menghasilkan dan menjalankan rangkaian pengujian
  • Agen peninjau memeriksa gaya, keamanan, dan kepatuhan arsitektur
  • Agen dokumentasi memperbarui dokumen agar sesuai dengan perubahan kode

Agen melakukan iterasi hingga pekerjaan mereka melewati gate kualitas. Intervensi manusia hanya diperlukan saat agen macet atau saat ada pertukaran (trade-off) yang memerlukan penilaian.

Verify (Verifikasi)

Manusia meninjau output agen terhadap tujuan awal:

  • Apakah memenuhi kriteria penerimaan?
  • Apakah memperkenalkan kerentanan keamanan?
  • Apakah arsitekturnya konsisten dengan basis kode yang ada?
  • Apakah pengujiannya bermakna atau hanya memeriksa jalur aman (happy paths)?
  • Apakah seorang insinyur manusia akan menyetujui PR ini?

Verifikasi bukan sekadar membubuhkan tanda tangan. Ini adalah fase di mana penilaian teknis paling kritis — Anda mengevaluasi apakah solusi agen tidak hanya berfungsi tetapi juga berkualitas baik.


Orkestrasi Multi-Agen: Praktik Inti

Agentic engineering bukan tentang satu AI yang melakukan segalanya. Ini tentang agen khusus dengan peran yang ditentukan yang bekerja sama di bawah orkestrasi manusia.

Model Tim Agen

Peran AgenTanggung JawabContoh Alat
Feature AuthorMenulis kode implementasiCodex, Claude Code, Cursor
Test GeneratorMembuat unit test, integrasi, dan E2ECodex, Claude Code
Code ReviewerMemeriksa gaya, pola, keamananLinter berbasis LLM kustom
Architecture GuardianMemvalidasi kepatuhan strukturalArchUnit + auditor LLM
Documentation WriterMemperbarui dokumen sesuai perubahanCodex, Claude Code
Security ScannerMengidentifikasi kerentananAlat SAST yang diperkuat AI
Release ManagerMengelola CI/CD, pemeriksaan deploymentAgen kustom

Bagaimana Mereka Berkoordinasi

Dalam praktiknya, alur kerja multi-agen mengikuti sebuah pipeline:

Deskripsi Tugas (Manusia)
  → Feature Author (menulis kode)
  → Test Generator (menulis pengujian)
  → Code Reviewer (meninjau perubahan)
  → Architecture Guardian (memeriksa kepatuhan)
  → Security Scanner (pemeriksaan kerentanan)
  → Tinjauan Manusia (persetujuan akhir)
  → CI/CD Pipeline (deployment otomatis)

Setiap agen menghasilkan artefak yang menjadi masukan bagi agen berikutnya. Manusia tetap menjadi pengambil keputusan di titik pemeriksaan utama, tetapi eksekusi di antara titik pemeriksaan tersebut sepenuhnya otonom.


Hasil Dunia Nyata: Apa yang Dicapai Perusahaan

TELUS: 13.000 Solusi AI, 500.000 Jam Dihemat

TELUS Digital menerapkan agentic engineering di seluruh organisasi mereka:

  • 13.000+ solusi AI khusus dibuat
  • Kode rekayasa dikirimkan 30% lebih cepat
  • Total 500.000+ jam dihemat
  • Penskalaan berlanjut ke tim non-rekayasa

Zapier: 89% Adopsi AI di Seluruh Organisasi

Pendekatan Zapier berfokus pada membuat alat agentic dapat diakses oleh semua orang:

  • 89% adopsi AI di seluruh organisasi
  • 800+ agen yang disebarkan secara internal
  • Non-insinyur menggunakan agen untuk alur kerja, analisis data, dan konten

Stripe: 1.000+ PR yang Digabungkan Per Minggu dari Agen

Sistem internal Minions milik Stripe mewakili agentic engineering yang matang:

  1. Pengembang memposting tugas di Slack
  2. Minion menulis kode
  3. Minion lolos CI
  4. Minion membuka PR
  5. Manusia meninjau dan menggabungkan (merge)

Nol interaksi antara penugasan tugas dan peninjauan PR. Harness menangani segalanya.

OpenAI: 1 Juta Baris Tanpa Kode Manusia

Tim Codex OpenAI sendiri membangun aplikasi produksi dengan:

  • 1 juta+ baris kode
  • Nol baris yang ditulis secara manual
  • ~1/10 waktu dari pengembangan tradisional
  • Pengguna harian internal dan penguji alfa eksternal
  • Produk dikirim, disebarkan, rusak, dan diperbaiki — semuanya oleh agen

Rakuten: Basis Kode 12,5 Juta Baris dalam 7 Jam

Rakuten menggunakan Claude Code untuk menyelesaikan implementasi vLLM yang kompleks di seluruh basis kode 12,5 juta baris hanya dalam 7 jam dengan akurasi numerik 99,9%.


Tumpukan Keterampilan Agentic Engineering

Apa yang Berubah

Keterampilan TradisionalPadanan Agentic Engineering
Menulis kodeMenentukan maksud secara presisi
Debugging kodeDebugging perilaku agen
Tinjauan kodeValidasi output agen
PengujianDesain strategi pengujian
ArsitekturDesain sistem batasan
DokumentasiRekayasa pengetahuan yang dapat dibaca mesin
Manajemen proyekOrkestrasi multi-agen

Apa yang Tetap Sama

  • Keahlian domain — Anda tetap perlu tahu seperti apa perangkat lunak yang bagus
  • Pemikiran sistem — Memahami bagaimana komponen berinteraksi menjadi lebih penting, bukan kurang
  • Kesadaran keamanan — Agen tidak secara inheren mengetahui model ancaman Anda
  • Membaca kode — Anda akan membaca lebih banyak kode daripada sebelumnya, hanya saja tidak menulisnya

Apa yang Baru

  • Desain prompt untuk agen — Berbeda dari prompt chatbot; prompt agen adalah spesifikasi operasional
  • Desain harness — Membangun batasan, linter, dan loop umpan balik yang menjaga produktivitas agen
  • Context engineering — Memastikan agen memiliki informasi yang tepat pada waktu yang tepat
  • Evaluasi agen — Mengukur apakah agen Anda membaik atau menurun

Cara Memulai Agentic Engineering

Tahap 1: Alur Kerja Agen Tunggal

Jika Anda saat ini sedang melakukan vibe coding, tambahkan struktur:

  1. Tulis spek sebelum memberi prompt — Tentukan seperti apa hasil yang "selesai"
  2. Gunakan CLAUDE.md atau .cursorrules — Kodekan konvensi Anda
  3. Jalankan tes sebelum menerima — Jangan pernah menggabungkan kode AI yang belum diuji
  4. Tinjau diff dengan cermat — Cari pola AI slop (abstraksi yang tidak perlu, penanganan kesalahan yang berlebihan, API halusinasi)

Tahap 2: Pipeline Multi-Agen

Setelah Anda merasa nyaman dengan alur kerja agen tunggal yang terstruktur:

  1. Tambahkan agen pembuat tes — Pisahkan implementasi dari pengujian
  2. Tambahkan validasi CI — Gate kualitas otomatis antara agen dan tinjauan manusia
  3. Tambahkan agen dokumentasi — Jaga agar dokumen tetap sinkron dengan perubahan kode
  4. Mulai melacak metrik — Tingkat keberhasilan agen, tingkat penolakan tinjauan, tingkat pengenalan bug

Tahap 3: Adopsi Organisasi

Untuk tim yang menskalakan agentic engineering:

  1. Buat playbook internal — Dokumentasikan bagaimana agen harus digunakan untuk berbagai jenis tugas
  2. Tentukan kebijakan tata kelola — Apa yang memerlukan tinjauan manusia? Apa yang bisa digabungkan secara otomatis?
  3. Bangun harness bersama — Konfigurasi standar yang mengodekan konvensi di seluruh tim
  4. Berikan pelatihan peninjauan output agen — Berbeda dari tinjauan kode tradisional; fokus pada pola struktural dan keamanan
  5. Ukur dampak bisnis — Jam yang dihemat, peningkatan kecepatan, metrik kualitas

Agentic Engineering vs. Konsep Terkait

KonsepFokusCakupan
Vibe CodingPengembangan bantuan AI yang santaiPengembang tunggal, prototipe
Context EngineeringMengoptimalkan input/konteks modelInteraksi tunggal
Prompt EngineeringMembuat prompt yang efektifPrompt tunggal
Harness EngineeringInfrastruktur di sekitar agenDesain sistem agen
Agentic EngineeringMetodologi pengembangan AI-first yang lengkapSeluruh organisasi

Hubungannya:

  • Prompt engineering → bagaimana Anda berbicara dengan model
  • Context engineering → apa yang diketahui model
  • Harness engineering → apa yang membatasi model
  • Agentic engineering → bagaimana Anda membangun perangkat lunak dengan model

Agentic engineering mencakup ketiganya, menambahkan alur kerja tim, tata kelola, perubahan organisasi, dan integrasi proses bisnis.


Dimensi Keamanan

Laporan Coding Agentic Anthropic tahun 2026 menekankan bahwa agentic engineering harus menanamkan keamanan sejak hari pertama:

  • Agen dapat memperkenalkan kerentanan secara massal — Agen yang menulis 1.000 PR/minggu dengan tingkat kerentanan 1% menciptakan 10 kerentanan baru setiap minggu
  • Permukaan serangan meluas — Agen yang mengakses API, database, dan layanan eksternal menciptakan vektor baru
  • Pertahanan otomatis diperlukan — Tinjauan keamanan manual tidak dapat mengimbangi kode yang dihasilkan agen
  • Gate kualitas harus mencakup keamanan — Setiap siklus PEV harus mencakup pemindaian keamanan otomatis

Penskalaan yang sama yang membuat agentic engineering kuat untuk pengembangan juga berlaku bagi penyerang. Membangun keamanan ke dalam harness — bukan menambahkannya belakangan — adalah hal yang tidak bisa ditawar.


Perspektif Kami: Membangun Produk Berbasis AI dengan Agentic Engineering

Di NxCode, kami telah bertransisi dari pengembangan bantuan AI ke agentic engineering selama beberapa bulan terakhir. Inilah yang kami pelajari:

Apa yang Berhasil

  • Spek terstruktur sebelum eksekusi agen — 10 menit yang dihabiskan untuk menulis spek yang jelas menghemat waktu pengerjaan ulang berjam-jam
  • Pipeline agen multi-provider — Menggunakan Claude untuk keputusan arsitektur yang berat penalaran dan Codex untuk tugas implementasi volume tinggi
  • Validasi CI yang agresif — CI kami menangkap ~15% kode hasil agen yang seharusnya memperkenalkan bug
  • Alur kerja dokumentasi-terlebih-dahulu — Memperbarui dokumen sebelum menulis kode (melalui agen) menjaga basis pengetahuan tetap segar untuk sesi agen di masa mendatang

Apa yang Belum Berhasil (Belum)

  • Proyek multi-hari yang sepenuhnya otonom — Agen masih memerlukan titik pemeriksaan manusia setiap beberapa jam untuk pekerjaan yang kompleks
  • Refactoring lintas sistem — Agen menangani refactoring layanan tunggal dengan baik tetapi kesulitan dengan perubahan yang terkoordinasi di berbagai microservices
  • Keputusan arsitektur baru — Saat tidak ada preseden dalam basis kode, agen secara default menggunakan pola generik yang tidak sesuai dengan konteks spesifik

Intinya

Agentic engineering bukan tentang mengganti pengembang. Ini tentang melipatgandakan apa yang dapat dicapai oleh setiap pengembang. Tim yang menguasai disiplin ini akan mengirimkan 5-10x lebih banyak daripada mereka yang masih menulis setiap baris secara manual — bukan karena AI-nya lebih pintar, tetapi karena proses rekayasanya lebih baik.


Poin-Poin Penting

  1. Agentic engineering adalah evolusi profesional melampaui vibe coding — pengawasan terstruktur menggantikan pemberian prompt yang santai
  2. Loop PEV (Plan → Execute → Verify) adalah alur kerja inti yang menggantikan "prompt and hope"
  3. Orkestrasi multi-agen menggunakan agen khusus (penulis, penguji, peninjau, pemindai keamanan) yang bekerja secara terkoordinasi
  4. Hasil dunia nyata sangat signifikan: TELUS (500 ribu jam dihemat), Zapier (adopsi 89%), Stripe (1.000+ PR/minggu dari agen)
  5. Peran insinyur bergeser dari menulis kode menjadi merancang sistem, menentukan maksud, dan memvalidasi output
  6. Keamanan harus ditanamkan sejak hari pertama — pengembangan skala agen memerlukan keamanan skala agen
  7. Mulai dengan struktur: Tulis spek, kodekan konvensi, jalankan tes, tinjau dengan cermat — lalu tingkatkan skalanya

Sumber Daya Terkait

Back to all news
Enjoyed this article?

Bangun dengan NxCode

Ubah ide Anda menjadi aplikasi yang berfungsi — tanpa coding.

46.000+ developer membangun dengan NxCode bulan ini

Coba sendiri

Jelaskan yang Anda inginkan — NxCode membangunnya untuk Anda.

46.000+ developer membangun dengan NxCode bulan ini