Klíčové poznatky
- 98% výkon při 20% nákladech: Sonnet 4.6 dosahuje 79.6% oproti 80.8% u Opus 4.6 v SWE-bench -- rozdíl 1.2 bodu -- při ceně $3/$15 oproti $15/$75 za milion tokens.
- Exkluzivní funkce Opus: Agent Teams pro paralelní práci, extended thinking pro hluboké uvažování a 1M tokens context window (beta) jsou k dispozici pouze v Opus 4.6.
- Vědecký rozdíl je obrovský: Opus 4.6 dosahuje 91.3% oproti 74.1% u Sonnet v GPQA Diamond -- rozdíl 17.2 bodu, který je důležitý pro vědecké a výzkumné úkoly na expertní úrovni.
- Výchozí volba Sonnet: Používejte Sonnet 4.6 pro 80%+ úkolů; po Opus sáhněte pouze tehdy, když potřebujete nejhlubší uvažování, Agent Teams nebo pracujete s mnoha vzájemně propojenými soubory.
Claude Sonnet 4.6 vs Opus 4.6: Kompletní srovnávací příručka (2026)
March 2026 — Výběr mezi Claude Sonnet 4.6 a Opus 4.6 je nejčastějším rozhodnutím, kterému vývojáři čelí při práci s modely od Anthropic. Sonnet poskytuje 98% kódovacího výkonu Opus za pětinu ceny. Opus přináší hlubší uvažování, Agent Teams, extended thinking a 1M tokens context window. Tato příručka vám poskytne jasný rámec pro rozhodování, který model a kdy použít.
Rychlá srovnávací tabulka
Před hlubším ponorem do detailů je zde srovnání všech důležitých dimenzí vedle sebe.
| Dimenze | Sonnet 4.6 | Opus 4.6 |
|---|---|---|
| Cena za input | $3 / 1M tokens | $15 / 1M tokens |
| Cena za output | $15 / 1M tokens | $75 / 1M tokens |
| Násobitel ceny | 1x (základ) | 5x |
| SWE-bench Verified | 79.6% | 80.8% |
| GPQA Diamond | 74.1% | 91.3% |
| OSWorld-Verified | 72.5% | 72.7% |
| Standardní context window | 200K tokens | 200K tokens |
| Extended context (beta) | Není k dispozici | 1M tokens |
| Agent Teams | Není k dispozici | Podporováno |
| Extended thinking | Není k dispozici | Podporováno |
| Rychlost odpovědi | Rychlá | Pomalejší |
| Nejlepší pro | Každodenní kódování, automatizace | Komplexní uvažování, velké refaktorizace |
| Dostupnost | Zdarma, Pro, API, Claude Code | Pro, API, Claude Code |
Krátká verze: Sonnet 4.6 je správnou výchozí volbou pro naprostou většinu úkolů. Opus 4.6 je nástroj, po kterém sáhnete, když problém vyžaduje nejhlubší uvažování nebo specializované funkce jako Agent Teams.
Hloubková analýza benchmarků
SWE-bench Verified
SWE-bench Verified měří schopnost modelu řešit skutečné GitHub issues komplexně (end-to-end). Toto je benchmark, na kterém vývojářům záleží nejvíce.
| Model | Skóre |
|---|---|
| Opus 4.6 | 80.8% |
| Sonnet 4.6 | 79.6% |
| Opus 4.5 (předchozí gen) | 80.9% |
| Sonnet 4.5 (předchozí gen) | 77.2% |
Rozdíl 1.2 bodu mezi Sonnet 4.6 a Opus 4.6 je nejmenší v historii Claude. Pro srovnání, Sonnet 4.6 nyní překonává každý model Opus vydaný před verzí 4.5. Pro praktickou práci na kódu — opravu chyb, implementaci funkcí, psaní testů — je tento rozdíl zanedbatelný.
GPQA Diamond
Zde se Opus dostává výrazně do popředí. GPQA Diamond testuje vědecké uvažování na úrovni PhD v oborech fyziky, chemie a biologie.
| Model | Skóre |
|---|---|
| Opus 4.6 | 91.3% |
| Sonnet 4.6 | 74.1% |
Rozdíl 17.2 bodu je největším výkonnostním rozdílem mezi těmito dvěma modely v jakémkoli hlavním benchmarku. Pokud vaše práce zahrnuje pokročilé vědecké uvažování, výzkumnou analýzu nebo složité doménově specifické otázky, Opus 4.6 funguje na fundamentálně odlišné úrovni.
OSWorld-Verified (Computer Use)
Pro automatizaci GUI a desktopové úkoly oba modely fungují téměř identicky.
| Model | Skóre |
|---|---|
| Opus 4.6 | 72.7% |
| Sonnet 4.6 | 72.5% |
| GPT-5.2 | 38.2% |
Rozdíl 0.2 bodu je statistický šum. Oba modely téměř zdvojnásobují výkon nejbližšího konkurenta. Pro pracovní zátěž využívající Computer Use je Sonnet jasnou volbou, protože stojí 5x méně za efektivně identický výkon.
Chatbot Arena a uživatelské preference
Interní testování Anthropic odhalilo silné signály uživatelských preferencí:
- 70% testerů preferovalo Sonnet 4.6 před Sonnet 4.5
- 59% preferovalo Sonnet 4.6 před předchozí vlajkovou lodí Opus 4.5
Tyto výsledky zdůrazňují, jak moc se Sonnet zlepšil v následování instrukcí, kvalitě výstupu a praktické použitelnosti. Opus 4.6 zůstává nejschopnějším modelem v nabídce Anthropic, ale rozdíl v každodenním používání se výrazně zmenšil.
Srovnání cen
Cena za požadavek
Předpokládejme, že typická interakce při kódování využívá 2,000 input tokens a 8,000 output tokens:
| Model | Cena za Input | Cena za Output | Celkem za požadavek |
|---|---|---|---|
| Sonnet 4.6 | $0.006 | $0.12 | $0.126 |
| Opus 4.6 | $0.03 | $0.60 | $0.63 |
Opus stojí přesně 5x více za požadavek.
Scénáře měsíčních nákladů
| Úroveň využití | Požadavků/měsíc | Sonnet 4.6 | Opus 4.6 | Měsíční úspory |
|---|---|---|---|---|
| Samostatný vývojář | 3,000 | $378 | $1,890 | $1,512 |
| Malý tým (5 vývojářů) | 15,000 | $1,890 | $9,450 | $7,560 |
| Startup | 30,000 | $3,780 | $18,900 | $15,120 |
| Enterprise | 300,000 | $37,800 | $189,000 | $151,200 |
V podnikovém měřítku činí roční rozdíl přes $1.8 million. I pro samostatného vývojáře ušetří používání Sonnet jako výchozí volby přes $18,000 ročně. Tato čísla hovoří pro strategický přístup: používejte Sonnet jako výchozí a Opus si rezervujte pro úkoly, které ho skutečně vyžadují.
Odhad nákladů podle typu úkolu
| Úkol | Sonnet 4.6 | Opus 4.6 | Doporučení |
|---|---|---|---|
| Rychlá oprava chyby | ~$0.10 | ~$0.50 | Sonnet |
| Implementace funkce | ~$0.25 | ~$1.25 | Sonnet |
| Code review (jeden soubor) | ~$0.15 | ~$0.75 | Sonnet |
| Multi-file refactor | ~$0.50 | ~$2.50 | Opus (stojí za příplatek) |
| Plánování architektury | ~$0.30 | ~$1.50 | Opus |
| Analýza velké codebase | ~$1.00 | ~$5.00 | Opus (s 1M context) |
Srovnání rychlosti
Latence odpovědi je pro produktivitu vývojáře důležitá. Čas strávený čekáním je čas, kdy nekódujete.
Sonnet 4.6 je znatelně rychlejší než Opus 4.6 ve všech typech úkolů. Přestože přesná latence závisí na délce promptu, délce výstupu a vytížení serveru, obecný vzorec je konzistentní:
- Sonnet 4.6: Rychlé odpovědi vhodné pro interaktivní kódování. Působí konverzačně.
- Opus 4.6: Pomalejší odpovědi, zejména s aktivovaným extended thinking. Vhodnější pro úkoly na pozadí, kde odešlete složitý požadavek a během čekání přepnete kontext.
Pro iterativní vývoj — psaní funkce, kontrola výstupu, úprava promptu — se výhoda rychlosti Sonnet sčítá. Během celého dne kódování je ušetřený kumulativní čas značný.
Když Opus používá extended thinking u složitých problémů, doba odezvy se dále zvyšuje, ale kvalita uvažování se smysluplně zlepšuje. Tento kompromis stojí za to u skutečně těžkých problémů, ale pro rutinní úkoly je neefektivní.
Context Window: 200K vs 1M Beta
Standardní Context (200K tokens)
Oba modely sdílejí standardní 200K tokens context window, což je přibližně 150,000 slov nebo kolem 500 stran kódu. Pro většinu úkolů kódování je 200K tokens více než dost na to, aby pojalo relevantní soubory vašeho projektu, historii konverzace a instrukce.
Extended Context: Pouze Opus 4.6 (1M Beta)
Opus 4.6 nabízí 1M tokens context window v beta verzi — 5x více než standardní okno. To mění pravidla hry pro specifické případy použití:
- Analýza velké codebase: Nahrajte core moduly celého monorepo do jedné relace.
- Sledování závislostí mezi soubory: Pochopte, jak se změny v jednom souboru promítnou do stovek dalších.
- Migrace staršího kódu (legacy): Mějte současně k dispozici starou i novou codebase pro přesný překlad.
- Komplexní revize kódu: Revidujte celou feature branch s plným kontextem.
Sonnet 4.6 nemá možnost 1M tokens. Pokud váš workflow pravidelně vyžaduje porozumění vztahům napříč masivním množstvím kódu, může to samo o sobě ospravedlnit použití Opus pro tyto konkrétní relace.
Praktické rady pro Context Window
Většina vývojářů pro každodenní práci 1M tokens nepotřebuje. Typická relace kódování využívá 10K-50K tokens kontextu. 200K okno u obou modelů zvládne prakticky všechny standardní pracovní postupy. Rezervujte si 1M context pro relace, kde explicitně analyzujete velkou codebase nebo provádíte rozsáhlé refaktorizace.
Výkon při kódování: Reálné scénáře
Benchmarky měří potenciál. Reálné využití určuje hodnotu. Zde je návod, jak si jednotlivé modely vedou v běžných úlohách kódování.
V čem Sonnet 4.6 vyniká
Psaní nových funkcí a modulů. Sonnet produkuje čistý, dobře strukturovaný kód rychle. Pro implementaci nového API endpointu, vytvoření komponenty React nebo napsání pomocné funkce je kvalita výstupu Sonnet v praxi nerozeznatelná od Opus.
Oprava chyb. Na základě chybové zprávy a relevantního kódu Sonnet s vysokou přesností identifikuje příčiny a navrhuje opravy. Rozdíl 1.2 bodu v SWE-bench se v typických scénářích oprav chyb neprojevuje.
Psaní testů. Sonnet generuje komplexní sady testů s dobrým pokrytím hraničních případů. Spolehlivě dodržuje testovací konvence (Jest, pytest, Go testing) a přehledně strukturuje testy.
Revize kódu a návrhy. Pro revizi pull requests, zachycení logických chyb a navrhování vylepšení jednotlivých souborů je Sonnet rychlý a důkladný.
V čem Opus 4.6 vyniká
Refaktorizace více souborů. Když změna vyžaduje pochopení a úpravu 10+ souborů současně — přejmenování základní abstrakce, migrace z jednoho vzoru na druhý, restrukturalizace hranic modulů — hlubší uvažování Opus produkuje ucelenější výsledky.
Architektonická rozhodnutí. Opus lépe zvažuje kompromisy v rámci celého systému. Otázky typu „Měli bychom tuto službu rozdělit?“ nebo „Jaký je nejlepší datový model pro tuto funkci?“ těží z vynikající hloubky uvažování Opus.
Komplexní ladění. Pokud chyba zahrnuje jemné interakce mezi více systémy — souběhy (race conditions), selhání distribuovaných systémů, komplexní správu stavu — Opus sleduje logiku spolehlivěji.
Bezpečnostní audity. Testování Anthropic zjistilo, že Opus 4.6 je schopen najít více než 500 dříve neznámých zranitelností. Pro důkladnou bezpečnostní revizi hlubší analýza ospravedlňuje náklady.
Agent Teams: Exkluzivně pro Opus 4.6
Agent Teams je jednou z nejpůsobivějších funkcí Opus 4.6 a není k dispozici v Sonnet.
Co Agent Teams dělají
Agent Teams vám umožňují spustit více instancí Claude, které pracují na různých částech projektu současně. Namísto postupného žádání Claude o napsání testů, následnou refaktorizaci modulu a poté aktualizaci dokumentace můžete všechny tři úkoly zadat paralelně.
Praktické příklady Agent Teams
- Jeden agent píše unit testy, zatímco jiný refaktoruje testovaný modul.
- Jeden agent migruje databázová schémata, zatímco jiný aktualizuje vrstvu ORM.
- Jeden agent vytváří API, zatímco jiný vytváří integraci frontend.
- Jeden agent provádí revizi kódu, zatímco jiný píše dokumentaci.
Kdy na Agent Teams záleží
Agent Teams přinášejí největší hodnotu u velkých projektů s nezávislými pracovními proudy. Pokud pracujete na soustředěném úkolu v jediném souboru, Agent Teams nepřinášejí žádný užitek. Ale u rozsáhlé funkce, která se dotýká více modulů, může paralelizace práce výrazně zkrátit celkovou dobu dokončení.
Tato funkce je hlavním důvodem, proč zvolit Opus pro práci na úrovni celého projektu spíše než na úrovni jednotlivých úkolů.
Extended Thinking: Exkluzivně pro Opus 4.6
Extended thinking umožňuje Opus 4.6 promýšlet problémy krok za krokem před vygenerováním konečné odpovědi. To se liší od standardního odvozování a je to obzvláště cenné u problémů, které vyžadují plánování, vícekrokovou logiku nebo zvažování složitých kompromisů.
Kdy Extended Thinking pomáhá
- Návrh algoritmů: Promýšlení kompromisů časové/prostorové složitosti před psaním kódu.
- Ladění složitých problémů: Systematické sledování cest provádění skrze vzájemně závislé systémy.
- Plánování architektury: Vyhodnocování více přístupů před rozhodnutím o návrhu.
- Matematické uvažování: Práce na důkazech, optimalizacích a kvantitativní analýze.
Kdy je Extended Thinking zbytečné
Pro přímočaré úkoly — „napiš funkci, která seřadí tento seznam“, „oprav tuto chybu null pointer“, „přidej loading spinner k této komponentě“ — extended thinking zvyšuje latenci bez zlepšení kvality výstupu. Těmto úkolům lépe slouží rychlé a přímé odpovědi Sonnet.
Kdy použít Sonnet 4.6
Použijte Sonnet, když:
- Píšete nové funkce, komponenty nebo moduly.
- Opravujete chyby s jasnými chybovými zprávami a stack traces.
- Implementujete jasně definované funkce podle specifikací.
- Píšete a aktualizujete testy.
- Revidujete jednotlivé soubory nebo malé pull requests.
- Generujete boilerplate kód a scaffolding.
- Refaktorujete v rámci jednoho souboru.
- Píšete dokumentaci a komentáře.
- Potřebujete rychlé Q&A o API, knihovnách nebo funkcích jazyka.
- Probíhají interaktivní relace kódování, kde záleží na rychlosti.
- Jakýkoli úkol, kde je prioritou efektivita nákladů.
- Pracujete s Computer Use a automatizací GUI.
Sonnet by měl být vaším výchozím modelem. Sáhněte po něm jako první a přepněte, až když narazíte na zeď.
Kdy použít Opus 4.6
Použijte Opus, když:
- Refaktorujete napříč 10+ soubory, které sdílejí složité závislosti.
- Děláte architektonická rozhodnutí, která ovlivňují celý projekt.
- Ladíte jemné problémy zahrnující race conditions nebo distribuované systémy.
- Provádíte bezpečnostní audity nebo analýzu zranitelností.
- Analyzujete velké codebase pomocí 1M tokens context window.
- Používáte Agent Teams k paralelizaci nezávislých pracovních proudů.
- Řešíte problémy, které vyžadují extended thinking a uvažování krok za krokem.
- Odpovídáte na vědecké nebo výzkumné otázky na expertní úrovni (GPQA Diamond: 91.3%).
- Plánujete velké migrace (framework, jazyk nebo infrastruktura).
- Revidujete velké feature branches s mnoha propojenými změnami.
Opus je specializovaný nástroj. Nasazujte ho tehdy, když problém skutečně vyžaduje jeho schopnosti.
Pravidlo 80/20: Praktický každodenní workflow
Nejefektivnějším přístupem ke Claude není výběr jednoho modelu — je to výběr obou a inteligentní směrování.
Rámec
80% vaší práce směřuje do Sonnet 4.6. To zahrnuje psaní kódu, opravu chyb, přidávání funkcí, psaní testů, revizi kódu a obecné Q&A. Sonnet toto vše zvládá ve vysoké kvalitě s rychlou odezvou a nízkými náklady.
20% vaší práce směřuje do Opus 4.6. To zahrnuje komplexní refaktorizace, architektonická rozhodnutí, analýzu velkých codebase, Agent Teams workflow a problémy, na kterých se Sonnet při prvním pokusu zasekne.
Jak to implementovat v Claude Code
- Nastavte Sonnet 4.6 jako svůj výchozí model.
- Pracujte na svých úkolech běžným způsobem.
- Když narazíte na problém, který vyžaduje hlubší uvažování — refaktorizaci více souborů, architektonickou otázku, složité ladění — přepněte na Opus.
- Jakmile je těžký problém vyřešen, přepněte se pro další úkol zpět na Sonnet.
Signál k eskalaci
Přepněte na Opus, když:
- Odpověď Sonnet je neúplná nebo postrádá důležitý kontext.
- Úkol vyžaduje pochopení vztahů napříč mnoha soubory.
- Potřebujete Agent Teams k paralelizaci práce.
- Problém vyžaduje 1M tokens context, aby se do něj vešel všechen relevantní kód.
- Děláte rozhodnutí s dlouhodobými architektonickými důsledky.
Tipy pro optimalizaci nákladů
1. Vždy začínejte se Sonnet
Nastavte Sonnet 4.6 jako výchozí v Claude Code a v konfiguracích API. Důkazní břemeno by mělo být na přepnutí na Opus, nikoli na setrvání u Sonnet.
2. Dávkujte své využití Opus
Místo přepínání na Opus u jednotlivých otázek seskupujte složité úkoly do dedikovaných relací Opus. To vám umožní využít načtený kontext a sníží režii spojenou s přepínáním modelů.
3. Používejte 1M Context strategicky
1M tokens context window u Opus je výkonné, ale drahé. Načtěte svou codebase jednou a položte více otázek v rámci stejné relace, místo abyste pokaždé začínali znovu.
4. Využijte Agent Teams pro paralelní práci
Máte-li více nezávislých úkolů, Agent Teams v Opus je mohou dokončit rychleji než sekvenční požadavky na Sonnet. Spočítejte si, zda úspora času ospravedlní zvýšení nákladů pro vaši konkrétní pracovní zátěž.
5. Sledujte své vzorce používání
Sledujte, které úkoly směrujete do Opus, a vyhodnoťte, zda skutečně těžily z upgradu. Postupem času si vytvoříte intuici pro to, které problémy si zaslouží prémiovou cenu.
6. Zvažte Haiku pro jednoduché úkoly
Pro vysokoobjemové úkoly s nízkou složitostí, jako je klasifikace, extrakce nebo jednoduché formátování, je model Haiku od Anthropic 12x levnější než Sonnet. Tříúrovňová strategie směrování — Haiku, Sonnet, Opus — maximalizuje efektivitu nákladů.
Závěr
Claude Sonnet 4.6 a Opus 4.6 jsou oba výjimečné modely, ale v pracovním postupu vývojáře slouží k různým účelům.
Sonnet 4.6 je dříč. S cenou $3/$15 za milion tokens a výsledkem 79.6% v SWE-bench Verified poskytuje vynikající kódovací výkon za cenu, která je škálovatelná. Je rychlý, spolehlivý a zvládá naprostou většinu úkolů bez kompromisů.
Opus 4.6 je specialista. S cenou $15/$75 za milion tokens a výsledky 80.8% v SWE-bench, 91.3% v GPQA Diamond, funkcemi Agent Teams, extended thinking a 1M tokens context window jde o nejschopnější model AI dostupný pro komplexní uvažování a rozsáhlou práci na kódu.
Správnou strategií není vybrat si jeden z nich. Je to jejich inteligentní využívání. Používejte Sonnet pro 80% své práce. Eskalujte na Opus pro zbývajících 20%, které to vyžadují. Tento přístup vám poskytne to nejlepší z obou světů: rychlou, cenově dostupnou každodenní produktivitu a hluboké, výkonné uvažování, když ho nejvíce potřebujete.
Oba modely jsou nyní k dispozici prostřednictvím Claude Code, Anthropic API a claude.ai. Začněte se Sonnet a sami poznáte, kdy je čas sáhnout po Opus.