Cursor Cloud Agents: Autonom kodning på virtuella maskiner som självtestar, spelar in demos och skickar PR:ar
Den 24 februari 2026 lanserade Cursor funktionen som flyttar AI-kodning från "copilot" till "kollega": Cloud Agents — helt autonoma AI-kodningsagenter som körs på isolerade virtuella maskiner som kan bygga mjukvara, testa den själva, spela in videodemonstrationer av sitt arbete och producera mergningsklara pull requests.
Det här är inte autokomplettering. Det är inte ens parprogrammering. Detta är delegerad ingenjörskonst — du beskriver vad du vill ha, och en AI går och gör det på sin egen dator medan du gör något annat.
30 % av Cursors egna mergade pull requests skapas nu av dessa agenter. Den siffran säger allt om vart mjukvaruutveckling är på väg.
Vad Cloud Agents faktiskt gör
Kärnkonceptet
Varje Cloud Agent får:
- Sin egen isolerade VM med en komplett utvecklingsmiljö
- Din kodbas — den läser in sig själv genom att skanna ditt repo
- En uppgift — beskriven på naturligt språk
- Autonomi — den arbetar självständigt tills den är klar
- Självtestning — den bygger och använder mjukvaran den skapar
- Bevis — videor, skärmdumpar och loggar bifogade till PR:en
När den är klar får du en mergningsklar PR med artefakter som bevisar att ändringarna fungerar. Granska, merga, skeppa.
Vad "självtestning" innebär i praktiken
Detta är detaljen som skiljer Cloud Agents från allt annat. Agenten skriver inte bara kod och hoppas att den fungerar. Den:
- Startar upp applikationen i sin VM
- Navigerar i gränssnittet precis som en användare skulle göra
- Verifierar ändringarna visuellt och funktionellt
- Spelar in en video av sig själv när den använder mjukvaran
- Tar skärmdumpar av nyckeltillstånd
- Fångar loggar för felsökning
När du granskar PR:en läser du inte koden i blindo. Du ser en video där agenten demonstrerar att funktionen fungerar. Det förändrar arbetsflödet för granskning i grunden — du kan validera UI-ändringar på några sekunder istället för att hämta branchen och köra den lokalt.
Så använder du Cloud Agents
Från Cursor (Desktop/Webb)
- Öppna valfritt projekt i Cursor
- Beskriv uppgiften du vill ha utförd
- Välj "Run as Cloud Agent"
- Agenten läser in din kodbas, skapar sin VM och börjar arbeta
- Du får aviseringar under arbetets gång
- När den är klar, granska PR:en med de bifogade artefakterna
Från Slack
Det är här det blir intressant för teamflöden:
- Tagga Cursor-agenten i en Slack-kanal med en uppgift på naturligt språk
- Agenten plockar upp den, skapar en molnsession och börjar arbeta
- Den svarar i en Slack-tråd med en sammanfattning av utfört arbete
- PR:en är redo för granskning på GitHub
Från GitHub
Trigga agenter direkt från GitHub-issues eller kommentarer. Agenten läser ärendet, skapar en branch, arbetar på den och öppnar en PR — allt utan att någon behöver öppna en IDE.
Från mobilen
Samma som på skrivbordet — beskriv en uppgift, följ framstegen och granska artefakterna när det är klart.
Verkliga användningsfall som Cursor demonstrerade
1. Funktionsimplementering med testning
Uppgift: "Lägg till en knapp för mörkt läge på inställningssidan."
Agenten:
- Läser kodbasen för att förstå designsystemet
- Implementerar toggle-komponenten
- Lägger till CSS-variabler för mörkt läge
- Skriver enhetstester
- Startar appen, växlar mörkt läge på/av
- Spelar in en video som visar att knappen fungerar
- Öppnar en PR med alla artefakter
2. Fix av säkerhetsbrist
Uppgift: "Reproducera och fixa XSS-sårbarheten i kommentarsfältet."
Agenten:
- Läser sårbarhetsrapporten
- Reproducerar exploateringen i sin sandbox
- Implementerar input-sanering
- Verifierar fixen genom att testa exploateringen igen
- Dokumenterar fixen med före/efter-skärmdumpar
3. Genomgång av dokumentationssajt
Agenten spenderade 45 minuter med att autonomt navigera på en dokumentationssajt, identifiera trasiga länkar, fixa formateringsfel och uppdatera föråldrade kodexempel — med en fullständig videoinspelning av genomgången.
Siffrorna: Vad som händer hos Cursor
| Mått | Värde |
|---|---|
| PR:ar från Cloud Agents | 30 % av mergade PR:ar hos Cursor |
| Värdering | 29,3 miljarder dollar |
| Årlig intäkt (Annualized Revenue) | 1 miljard+ dollar (per november 2025) |
| Parallella agenter per användare | 10–20 samtidigt |
| Plattformar | Desktop, Webb, Mobil, Slack, GitHub |
Alexi Robbins, ingenjörschef för asynkrona agenter på Cursor:
"Istället för att ha en till tre saker som du gör samtidigt, kan du ha 10 eller 20 av dessa saker igång."
Cloud Agents vs. Claude Code vs. GitHub Copilot: En ärlig jämförelse
Vi har använt alla tre i stor omfattning. Här är vår ärliga bedömning:
| Förmåga | Cursor Cloud Agents | Claude Code + Remote Control | GitHub Copilot |
|---|---|---|---|
| Var koden körs | Moln-VM:ar | Din lokala maskin | Molnet |
| Parallellism | 10–20 agenter | En session (flera via Remote Control) | En arbetsyta |
| Självtestning | Ja, med videobevis | Nej (kör tester men ingen visuell verifiering) | Nej |
| PR-artefakter | Videor, skärmdumpar, loggar | Diffar och konversation | Diffar |
| Resonemangsdjup | Bra | Utmärkt (Claudes styrka) | Bra |
| Slack-integration | Ja | Nej | Begränsad |
| GitHub-integration | Ja | Via MCP | Inbyggd |
| Koden stannar lokalt | Nej (moln-VM:ar) | Ja | Nej |
| Mobil åtkomst | Ja | Ja (Remote Control) | Endast webb |
När ska man använda vad?
Använd Cursor Cloud Agents när:
- Du har många oberoende uppgifter att parallellisera
- Du vill ha visuella bevis på att ändringar fungerar (videoartefakter)
- Ditt team arbetar mycket i Slack/GitHub
- Du är bekväm med att kod körs i moln-VM:ar
Använd Claude Code när:
- Du behöver djupt, komplext resonemang över stora kodbaser
- Du vill att koden ska stanna på din lokala maskin (säkerhet/efterlevnad)
- Du utför en fokuserad uppgift som kräver interaktion fram och tillbaka
- Du behöver MCP-serverintegration med lokala verktyg
Använd båda när:
- Cursor Cloud Agents för högvolymuppgifter med tydliga ramar (10 buggfixar samtidigt)
- Claude Code för den där komplexa arkitektoniska refaktoreringen som kräver noggrann uppmärksamhet
Vad detta innebär för utvecklingsteam
Visionen om den "självkörande kodbasen"
Cursors långsiktiga vision är tydlig: agenter som hanterar PR-mergar, utrullningar och produktionsövervakning — vad de kallar "self-driving codebases". Cloud Agents är det första riktiga steget mot den visionen.
Produktivitetskalkylen
Om en utvecklare kan styra 10–20 parallella agenter:
- Utvecklingshastigheten (velocity) multipliceras med en tiopotens
- Kodgranskning blir flaskhalsen (vilket är anledningen till att videoartefakter är viktiga)
- Väldefinierade uppgifter (buggfixar, nya funktioner, testskrivning) delegeras till agenter
- Kreativt och arkitektoniskt arbete stannar hos människor
Kvalitetsfrågan
30 % av Cursors egna PR:ar kommer från agenter. Det betyder att Cursor litar tillräckligt mycket på dessa agenter för att merga deras kod i en produkt som används av miljoner. Men Cursor har också en stark CI/CD-kedja, en kultur för kodgranskning och omfattande testsviter. Agenterna arbetar inom ingenjörsprocesserna, inte runt dem.
För team utan starka granskningsrutiner kan autonoma agenter introducera problem snabbare än de löser dem. Cloud Agents förstärker din ingenjörskultur, oavsett hur den ser ut.
Praktiska tips från våra tester
-
Skriv tydliga och specifika uppgiftsbeskrivningar — "Fixa inloggningsknappen" är för vagt. "Inloggningsknappen på /auth/signin triggar inte validering på mobila Safari" är mycket bättre.
-
Sätt upp bra CI först — Cloud Agents producerar PR:ar, men din CI-pipeline validerar dem. Om dina tester är instabila (flaky) kommer du att slösa tid på att granska felaktiga misslyckanden.
-
Använd för väldefinierade uppgifter, inte utforskande arbete — "Lägg till paginering i användarlistans API" fungerar utmärkt. "Ta reda på varför appen känns långsam" gör det inte.
-
Granska videoartefakterna — De finns där av en anledning. En 30-sekunders videogranskning fångar visuella regressioner som en vanlig kodgranskning missar.
-
Börja med en agent — Bekanta dig med arbetsflödet innan du skalar upp till 10. Att granska 10 samtidiga PR:ar kräver disciplin.
Viktiga slutsatser
- Cloud Agents körs på isolerade VM:ar — var och en får en egen komplett utvecklingsmiljö.
- Självtestning med videobevis är den utstickande funktionen — agenterna bevisar att deras kod fungerar.
- 30 % av Cursors PR:ar kommer från agenter — detta är inte teoretiskt längre.
- 10–20 parallella agenter per användare — en enorm ökning av genomströmning.
- Tillgängligt via Desktop, Webb, Mobil, Slack och GitHub — möter utvecklare där de befinner sig.
- Cursors värdering på 29,3 miljarder dollar speglar marknadens tro på autonom kodning.
- Bäst för definierade, parallelliserbara uppgifter — inte en ersättning för mänskligt omdöme gällande arkitektur.
Relaterade resurser
- Claude Sonnet 4.6: Komplett guide — Den konkurrerande modellens styrkor inom djupt resonemang.
- Det agentiska webben förklarat: AGENTS.md, MCP vs A2A — Protokolllagret som möjliggör arbetsflöden med flera agenter.
- Bygg din webbplats med NxCode — Leverera snabbare med AI-driven webbutveckling.

