Cursor Cloud Agents: Autonomiczne kodowanie na maszynach wirtualnych, które same się testują, nagrywają dema i dostarczają PR
24 lutego 2026 r. Cursor uruchomił funkcję, która zmienia kodowanie AI z roli „copilota” na „kolegę” z zespołu: Cloud Agents — w pełni autonomiczni agenci AI do kodowania działający na odizolowanych maszynach wirtualnych, którzy potrafią budować oprogramowanie, samodzielnie je testować, nagrywać demonstracje wideo swojej pracy i dostarczać gotowe do scalenia pull requesty.
To nie jest autouzupełnianie. To nawet nie jest programowanie parowe. To delegowana inżynieria — opisujesz, czego chcesz, a AI idzie i robi to na własnym komputerze, podczas gdy Ty zajmujesz się czymś innym.
30% scalonych pull requestów Cursora jest teraz tworzonych przez tych agentów. Ta liczba mówi wszystko o tym, dokąd zmierza rozwój oprogramowania.
Co właściwie robią Cloud Agents
Główna koncepcja
Każdy Cloud Agent otrzymuje:
- Własną, izolowaną maszynę wirtualną (VM) z pełnym środowiskiem programistycznym
- Twoją bazę kodu — agent samodzielnie zapoznaje się z repozytorium
- Zadanie — opisane w języku naturalnym
- Autonomię — pracuje niezależnie aż do zakończenia zadania
- Autotestowanie — buduje i używa oprogramowania, które tworzy
- Dowody — wideo, zrzuty ekranu i logi dołączone do PR
Po zakończeniu pracy otrzymujesz gotowy do scalenia PR wraz z artefaktami potwierdzającymi poprawność zmian. Przeglądasz, scalasz, wdrażasz.
Co oznacza „autotestowanie” w praktyce
To detal, który odróżnia Cloud Agents od wszystkiego innego. Agent nie tylko pisze kod z nadzieją, że zadziała. On:
- Uruchamia aplikację na swojej maszynie wirtualnej
- Nawiguje po interfejsie użytkownika tak, jak robiłby to użytkownik
- Weryfikuje zmiany wizualnie i funkcjonalnie
- Nagrywa film, na którym sam korzysta z oprogramowania
- Robi zrzuty ekranu kluczowych stanów
- Przechwytuje logi do debugowania
Kiedy przeglądasz PR, nie czytasz kodu „w ciemno”. Oglądasz film, na którym agent demonstruje, że funkcja działa. To fundamentalnie zmienia przepływ pracy przy recenzji — możesz zatwierdzić zmiany w UI w kilka sekund, zamiast pobierać gałąź i uruchamiać ją lokalnie.
Jak korzystać z Cloud Agents
Z poziomu Cursora (Desktop/Web)
- Otwórz dowolny projekt w Cursorze
- Opisz zadanie, które chcesz wykonać
- Wybierz opcję „Run as Cloud Agent”
- Agent zapoznaje się z bazą kodu, tworzy swoją maszynę wirtualną i zaczyna pracę
- Otrzymujesz powiadomienia o postępach
- Po zakończeniu przejrzyj PR z dołączonymi artefaktami
Ze Slacka
Tutaj robi się interesująco w kontekście pracy zespołowej:
- Oznacz agenta Cursor na kanale Slack, podając zadanie w języku naturalnym
- Agent podejmuje zadanie, tworzy sesję w chmurze i zaczyna pracę
- Odpowiada w wątku na Slacku z podsumowaniem wykonanej pracy
- PR jest gotowy do przeglądu na GitHubie
Z GitHuba
Uruchamiaj agentów bezpośrednio ze zgłoszeń (issues) lub komentarzy na GitHubie. Agent czyta zgłoszenie, tworzy gałąź, pracuje nad nią i otwiera PR — wszystko to bez otwierania IDE przez człowieka.
Z telefonu (Mobile)
Tak samo jak na komputerze — opisz zadanie, monitoruj postępy i przejrzyj artefakty po zakończeniu.
Przykłady użycia zademonstrowane przez Cursora
1. Implementacja funkcji z testowaniem
Zadanie: „Dodaj przełącznik trybu ciemnego do strony ustawień”.
Agent:
- Czyta bazę kodu, aby zrozumieć system projektowania (design system)
- Implementuje komponent przełącznika
- Dodaje zmienne CSS dla trybu ciemnego
- Pisze testy jednostkowe
- Uruchamia aplikację, włącza i wyłącza tryb ciemny
- Nagrywa wideo pokazujące działanie przełącznika
- Otwiera PR ze wszystkimi artefaktami
2. Naprawa luki w zabezpieczeniach
Zadanie: „Zreprodukuj i napraw podatność XSS w sekcji komentarzy”.
Agent:
- Czyta raport o podatności
- Reprodukuje exploit w swoim piaskownicy (sandbox)
- Implementuje sanityzację danych wejściowych
- Weryfikuje poprawkę, ponownie testując exploit
- Dokumentuje naprawę zrzutami ekranu „przed” i „po”
3. Przegląd strony z dokumentacją
Agent spędził 45 minut autonomicznie nawigując po stronie dokumentacji, identyfikując niedziałające linki, naprawiając błędy formatowania i aktualizując nieaktualne przykłady kodu — z pełnym nagraniem wideo z tego procesu.
Liczby: Co dzieje się w Cursorze
| Metryka | Wartość |
|---|---|
| PR-y od Cloud Agents | 30% scalonych PR-ów w Cursorze |
| Wycena | 29,3 mld USD |
| Roczny przychód (ARR) | 1 mld+ USD (stan na listopad 2025) |
| Równolegli agenci na użytkownika | 10–20 jednocześnie |
| Platformy | Desktop, Web, Mobile, Slack, GitHub |
Alexi Robbins, współkierownik inżynierii ds. agentów asynchronicznych w Cursorze:
"Zamiast mieć jedną do trzech rzeczy, które robisz naraz i które działają w tym samym czasie, możesz mieć 10 lub 20 takich procesów uruchomionych jednocześnie".
Cloud Agents vs. Claude Code vs. GitHub Copilot: Szczere porównanie
Korzystaliśmy intensywnie ze wszystkich trzech narzędzi. Oto nasza ocena:
| Możliwość | Cursor Cloud Agents | Claude Code + Remote Control | GitHub Copilot |
|---|---|---|---|
| Gdzie działa kod | Maszyny wirtualne w chmurze | Twoja lokalna maszyna | Chmura |
| Równoległość | 10–20 agentów | Jedna sesja (wiele przez Remote Control) | Jeden obszar roboczy |
| Autotestowanie | Tak, z dowodami wideo | Nie (uruchamia testy, ale bez wizualnej weryfikacji) | Nie |
| Artefakty PR | Wideo, zrzuty ekranu, logi | Diffy i konwersacja | Diffy |
| Głębokość rozumowania | Dobra | Doskonała (siła Claude'a) | Dobra |
| Integracja ze Slackiem | Tak | Nie | Ograniczona |
| Integracja z GitHubem | Tak | Przez MCP | Natywna |
| Kod zostaje lokalnie | Nie (VM w chmurze) | Tak | Nie |
| Dostęp mobilny | Tak | Tak (Remote Control) | Tylko Web |
Kiedy czego używać
Wybierz Cursor Cloud Agents, gdy:
- Masz wiele niezależnych zadań do zrównoleglenia
- Chcesz wizualnego dowodu, że zmiany działają (artefakty wideo)
- Twój zespół intensywnie korzysta ze Slacka/GitHuba
- Nie masz problemu z kodem działającym na maszynach wirtualnych w chmurze
Wybierz Claude Code, gdy:
- Potrzebujesz głębokiego, złożonego rozumowania nad dużymi bazami kodu
- Chcesz, aby kod pozostał na Twojej lokalnej maszynie (bezpieczeństwo/zgodność)
- Wykonujesz jedno skupione zadanie, które wymaga iteracji „tam i z powrotem”
- Potrzebujesz integracji serwera MCP z lokalnymi narzędziami
Używaj obu, gdy:
- Cursor Cloud Agents do dużej liczby dobrze zdefiniowanych zadań (np. 10 poprawek błędów naraz)
- Claude Code do jednej złożonej refaktoryzacji architektury, która wymaga dużej uwagi
Co to oznacza dla zespołów programistycznych
Wizja „Samoprowadzącej się bazy kodu”
Długoterminowa wizja Cursora jest jasna: agenci zarządzający scalaniem PR, wdrażaniem i monitorowaniem produkcji — co nazywają „self-driving codebases”. Cloud Agents to pierwszy realny krok w stronę tej wizji.
Matematyka produktywności
Jeśli jeden programista może kierować 10–20 równoległymi agentami:
- Szybkość dostarczania funkcji wzrasta o rząd wielkości
- Przegląd kodu (Code Review) staje się wąskim gardłem (dlatego artefakty wideo są tak ważne)
- Zdefiniowane zadania (poprawki błędów, dodawanie funkcji, pisanie testów) są delegowane do agentów
- Praca kreatywna i architektoniczna pozostaje w rękach ludzi
Kwestia jakości
30% własnych PR-ów Cursora pochodzi od agentów. To oznacza, że Cursor ufa tym agentom na tyle, by scalać ich kod w produkcie używanym przez miliony. Ale Cursor posiada również silne CI/CD, kulturę code review i zestawy testów. Agenci pracują wewnątrz procesów inżynieryjnych, a nie obok nich.
W zespołach bez silnych praktyk przeglądu, autonomiczni agenci mogliby wprowadzać problemy szybciej, niż je rozwiązywać. Cloud Agents wzmacniają Twoją kulturę inżynieryjną, jakakolwiek by ona nie była.
Praktyczne wskazówki z naszych testów
-
Pisz jasne i konkretne opisy zadań — „Napraw przycisk logowania” jest zbyt ogólne. „Przycisk logowania na /auth/signin nie uruchamia walidacji formularza w mobilnym Safari” jest znacznie lepsze.
-
Najpierw skonfiguruj dobre CI — Cloud Agents tworzą PR-y, ale to Twój rurociąg CI je waliduje. Jeśli Twoje testy są niestabilne (flaky), stracisz czas na przeglądanie fałszywych błędów.
-
Używaj do dobrze zdefiniowanych zadań, nie do pracy badawczej — „Dodaj paginację do API listy użytkowników” działa świetnie. „Dowiedz się, dlaczego aplikacja wydaje się wolna” — już nie.
-
Przeglądaj artefakty wideo — istnieją nie bez powodu. 30-sekundowy przegląd wideo pozwala wyłapać regresje wizualne, które umykają przy czytaniu kodu.
-
Zacznij od jednego agenta — zapoznaj się z przepływem pracy przed skalowaniem do 10. Przeglądanie 10 jednoczesnych PR-ów wymaga dyscypliny.
Kluczowe wnioski
- Cloud Agents działają na izolowanych maszynach wirtualnych — każdy otrzymuje pełne środowisko programistyczne.
- Autotestowanie z dowodami wideo to wyróżniająca się funkcja — agenci udowadniają, że ich kod działa.
- 30% PR-ów Cursora pochodzi od agentów — to nie jest tylko teoria.
- 10–20 równoległych agentów na użytkownika — ogromny wzrost wydajności.
- Dostępne z Desktopu, Weba, Mobile, Slacka i GitHuba — tam, gdzie są programiści.
- Wycena Cursora na poziomie 29,3 mld USD odzwierciedla wiarę rynku w autonomiczne kodowanie.
- Najlepsze do zdefiniowanych, równoległych zadań — nie zastępują ludzkiego osądu w kwestiach architektury.
Powiązane zasoby
- Claude Sonnet 4.6: Kompletny przewodnik — Siła konkurencyjnego modelu w głębokim rozumowaniu.
- Agentic Web wyjaśnione: AGENTS.md, MCP vs A2A — Warstwa protokołów umożliwiająca przepływy pracy z wieloma agentami.
- Zbuduj swoją stronę z NxCode — Dostarczaj projekty szybciej dzięki tworzeniu stron wspomaganemu przez AI.

