Gemini 3.1 Pro teljes útmutató: Benchmarkok, árazás, API és minden, amit tudni érdemes
2026. február 19. — A Google éppen most adta ki a Gemini 3.1 Pro modellt, ami jelentős előrelépést jelent. Az ARC-AGI-2 teszten elért 77,1%-os eredményével (ami több mint duplája a Gemini 3 Pro 31,1%-ának), az SWE-Bench Verified teszten elért 80,6%-kal, és a GPQA Diamond-on mutatott 94,3%-kal ez az első alkalom, hogy a Google 0,1-es verziólépcsőt bocsátott ki — és a teljesítménynövekedés igazolja a hagyomány megtörését.
A legjobb rész? Ugyanannyiba kerül, mint a Gemini 3 Pro — 2 dollár egymillió bemeneti tokenenként. Ha már használja a Gemini 3 Pro-t, ez egy ingyenes frissítés.
Ez az útmutató mindenre kiterjed: mi változott, teljes benchmark-elemzések, API árazás, a kezdő lépések, kódolási képességek, valamint őszinte érvek és ellenérvek.
Mi az a Gemini 3.1 Pro?
A Gemini 3.1 Pro a Google DeepMind legújabb zászlóshajó modellje, amely a gyors Gemini 3 Flash és a kutatás-orientált Gemini 3 Deep Think között helyezkedik el. Komplex érvelésre, több lépésből álló problémamegoldásra és olyan produkciós feladatokra tervezték, amelyek mélyebb válaszokat igényelnek a felületes reakcióknál.
Mi az újdonság a Gemini 3 Pro-hoz képest?
| Funkció | Gemini 3 Pro | Gemini 3.1 Pro |
|---|---|---|
| ARC-AGI-2 | 31,1% | 77,1% (+148%) |
| SWE-Bench Verified | ~68% | 80,6% (+18%) |
| GPQA Diamond | ~87% | 94,3% |
| Gondolkodási szintek | Alapszintű | Alacsony / Közepes / Magas |
| Kimeneti hatékonyság | Alapszint | Kevesebb token, jobb eredmény |
| Árazás | 2$/12$ / 1M | 2$/12$ / 1M (ugyanaz) |
A legfontosabb architekturális fejlesztés abban rejlik, ahogy a modell a "gondolkodási" tokeneket kezeli. A Gemini 3.1 Pro hatékonyabban használja az érvelést, így kevesebb kimeneti tokent igényel, miközben megbízhatóbb eredményeket ad. A JetBrains AI igazgatója, Vladislav Tankov úgy jellemezte: "erősebb, gyorsabb... és hatékonyabb".
Benchmark-elemzés
A Google jelentése szerint a Gemini 3.1 Pro vezet az általuk értékelt 16 benchmarkból 13-ban. Íme a teljes összehasonlítás:
Érvelés és tudomány
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|---|
| ARC-AGI-2 | 77,1% | 37,6% | 54,2% | 31,1% |
| GPQA Diamond | 94,3% | 91,3% | 92,4% | ~87% |
| Humanity's Last Exam (eszközök nélkül) | 44,4% | 41,2% | 34,5% | 37,5% |
| Humanity's Last Exam (eszközökkel) | 51,4% | 53,1% | — | — |
| MMMMU-Pro | 75,8% | — | — | — |
Kódolás
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.3-Codex | Gemini 3 Pro |
|---|---|---|---|---|
| SWE-Bench Verified | 80,6% | 72,6% | 76,2% | ~68% |
| LiveCodeBench Pro | 2887 Elo | — | — | — |
| Terminal-Bench 2.0 | 68,5% | — | 77,3% | — |
| SWE-Bench Pro (Nyilvános) | 54,2% | — | 56,8% | — |
Ágens-alapú feladatok
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 |
|---|---|---|---|
| APEX-Agents | 33,5% | 29,8% | 23,0% |
| Long-Context MRCR v2 (128k) | 84,9% | 84,9% (döntetlen) | — |
Hol nyernek az egyes modellek?
- Gemini 3.1 Pro: Érvelés (ARC-AGI-2), tudomány (GPQA), ágens feladatok (APEX), SWE-Bench Verified, ár-érték arány.
- Claude Opus 4.6: Szakértői feladat-preferenciák (GDPval-AA Elo: 1606 vs 1317), Humanity's Last Exam eszközökkel, Arena kódolási ranglista.
- GPT-5.3-Codex: Terminal-Bench 2.0, SWE-Bench Pro — specializált kódolási benchmarkok.
További részletekért a Claude és a GPT összehasonlításáról olvassa el a GPT-5.3 Codex vs Claude Opus 4.6 kódolási összehasonlításunkat.
API árazás és csomagok
A Gemini 3.1 Pro árazása megegyezik a Gemini 3 Pro árazásával — ami hatalmas teljesítményugrást jelent plusz költség nélkül.
API árazás
| Szint | Bemenet (1M tokenenként) | Kimenet (1M tokenenként) |
|---|---|---|
| 200 ezer tokenig | 2,00 $ | 12,00 $ |
| 200 ezer token felett | 4,00 $ | 18,00 $ |
| Kontextus gyorsítótár (találat) | 0,50 $ | 12,00 $ |
Költségösszehasonlítás
| Modell | Bemenet (/1M) | Kimenet (/1M) | Relatív költség |
|---|---|---|---|
| Gemini 3.1 Pro | 2,00 $ | 12,00 $ | 1x (bázis) |
| Claude Sonnet 4.6 | 3,00 $ | 15,00 $ | 1,5x / 1,25x |
| Claude Opus 4.6 | 15,00 $ | 75,00 $ | 7,5x / 6,25x |
| GPT-5.2 | ~10,00 $ | ~30,00 $ | 5x / 2,5x |
Előfizetési csomagok
| Csomag | Ár | Mit tartalmaz? |
|---|---|---|
| Free (AI Studio) | 0 $ | API hozzáférés korlátozásokkal |
| Google AI Pro | 19,99 $/hó | Teljes hozzáférés a 3.1 Pro-hoz, Deep Research, 1M kontextus |
| Google AI Ultra | 124,99 $/hó | Minden + Deep Think, Veo 3.1 Fast, legmagasabb limitek |
Hogyan használjuk a Gemini 3.1 Pro-t?
Google AI Studio (A leggyorsabb kezdés)
- Látogasson el a Google AI Studio oldalra.
- Válassza ki a Gemini 3.1 Pro Preview modellt a legördülő menüből.
- Kezdje el a promptolást — ingyenes, de korlátozott számú kéréssel.
API hozzáférés (Python)
from google import genai
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="Explain the architectural differences between microservices and monoliths",
config={
"thinking_config": {"thinking_level": "MEDIUM"}
}
)
print(response.text)
API hozzáférés (Node.js)
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "YOUR_API_KEY" });
const response = await ai.models.generateContent({
model: "gemini-3.1-pro-preview",
contents: "Write a Python function to merge two sorted arrays efficiently",
});
console.log(response.text);
Egyéb platformok
- Gemini CLI:
gemini --model gemini-3.1-pro-preview "your prompt" - GitHub Copilot: Válassza a Gemini 3.1 Pro-t a modellválasztóból.
- VS Code: Elérhető a Copilot bővítményen keresztül.
- Vertex AI: Vállalati munkákhoz, SLA-kkal.
- Google Antigravity: A Google ágens-alapú fejlesztői platformja.
Kódolási képességek
A Gemini 3.1 Pro egy élvonalbeli kódoló modell. A benchmarkok önmagukért beszélnek:
- SWE-Bench Verified: 80,6% — valódi GitHub problémák teljes körű megoldása.
- LiveCodeBench Pro: 2887 Elo — versenyképes kódolási teljesítmény.
- 15%-os javulás a legjobb Gemini 3 Pro Preview futtatásokhoz képest.
Mire képes?
Kódgenerálás: Teljes függvények, modulok és alkalmazások írása leírások alapján. Az 1 millió tokenes kontextus azt jelenti, hogy képes átlátni a teljes kódbázist az új kód generálása előtt.
Hibakeresés (Debugging): Adjon meg neki hibanaplókat, stack trace-eket és a releváns forrásfájlokat. A Magas gondolkodási szinttel szisztematikusan képes végigvezetni a komplex, több fájlt érintő hibákat.
Kódátvizsgálás (Code Review): Közepes gondolkodási szinten kiegyensúlyozott kódátvizsgálást nyújt — kiszúrja a hibákat anélkül, hogy túlgondolná az egyszerű módosításokat.
Kreatív kódolás: A Gemini 3.1 Pro képes a tervezői szándékot kódra fordítani. A Hostinger megjegyezte, hogy a modell "megérti a felhasználói prompt mögötti hangulatot", és olyan kódot generál, amely tükrözi a stílust és a termék célját, nem csak a szintaktikát.
SVG generálás: Kimagasló képesség — képes weboldalba illeszthető animált SVG-ket generálni közvetlenül szöveges leírásból. Mivel ezek tiszta kódok, bármilyen felbontásban élesek maradnak.
Hol marad el?
A GPT-5.3-Codex továbbra is vezet a Terminal-Bench 2.0 (77,3% vs 68,5%) és az SWE-Bench Pro (56,8% vs 54,2%) teszteken. A mély terminál-interakciót igénylő, magasan specializált kódolási feladatokhoz továbbra is az OpenAI Codex modelljei a jobbak.
A kódolási képességek részletes összehasonlításához nézze meg a Cursor vs Windsurf vs Claude Code összehasonlításunkat.
1 millió tokenes kontextusablak
Az 1 millió tokenes bemeneti kontextus a Gemini 3.1 Pro egyik legnagyobb előnye. Hogy perspektívába helyezzük:
| Tartalom típusa | Hozzávetőleges méret |
|---|---|
| Átlagos regény | ~100 ezer token |
| Nagy kódbázis (500 fájl) | ~500 ezer token |
| Teljes jogi szerződéscsomag | ~200 ezer token |
| Kutatási dokumentum gyűjtemény (20 tanulmány) | ~400 ezer token |
Felhasználási esetek
- Kódbázis elemzése: Töltse be a teljes repót, és tegyen fel kérdéseket az architektúráról, keressen fájlokon átívelő hibákat, vagy tervezzen refaktorálásokat.
- Dokumentumfeldolgozás: Töltsön fel hosszú szerződéseket, megfelelőségi dokumentumokat vagy kutatási papírokat elemzésre.
- Többfordulós kutatás: Tartson fenn kiterjedt beszélgetési kontextust anélkül, hogy a korábbi információk elvesznének.
- Keresztellenőrzés: Elemezzen több dokumentumot egyszerre, hogy ellentmondásokat vagy összefüggéseket találjon.
A Claude Opus 4.6 200 ezer tokent támogat — ami jelentős, de a Gemini 1 milliója ötszörös előnyt jelent a hosszú kontextusú feladatoknál. Mindkét modell 84,9%-ot ért el az MRCR v2 (128k átlag) teszten, ami hasonló minőséget sugall a közös kontextustartományban.
Gondolkodási szintek: Alacsony, Közepes, Magas
A Gemini 3.1 Pro bevezeti a konfigurálható gondolkodási szinteket, amelyekkel kérésenként szabályozható az érvelési mélység:
| Szint | Legjobb ehhez | Érvelési mélység | Költségvonzat |
|---|---|---|---|
| Alacsony | Automatikus kiegészítés, egyszerű keresések, osztályozás | Minimális | Legalacsonyabb |
| Közepes | Kódátvizsgálás, összegzés, mérsékelt elemzés | Kiegyensúlyozott | Standard |
| Magas | Komplex hibakeresés, több lépéses érvelés, kutatás | Mély | Legmagasabb |
Hogyan állítsuk be a gondolkodási szintet?
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="Debug this race condition in my Go server...",
config={
"thinking_config": {"thinking_level": "HIGH"}
}
)
Ez egy praktikus költségoptimalizálási eszköz. Nem minden kérés igényel maximális érvelést — az Alacsony szint használata egyszerű feladatokhoz, és a Magas csak a komplexekhez jelentősen csökkentheti az API-kiadásokat.
Érvek és ellenérvek
Érvek
- A legjobb ár-érték arány: Vezet a legtöbb benchmarkban 2$/12$ dolláros áron — a bemeneti oldalon 7,5-szer olcsóbb, mint az Opus 4.6.
- 1 millió tokenes kontextus: A legnagyobb produkciós kontextusablak a csúcsmodellek között.
- ARC-AGI-2 dominancia: 77,1%-os érvelési pontszám, ami több mint duplája bármely korábbi Gemini modellnek.
- Kódolási erő: 80,6% SWE-Bench Verified, a legjobbak között.
- Gondolkodási szintek: Finomhangolható kontroll a költség és az érvelési mélység felett.
- Széleskörű elérhetőség: AI Studio, API, GitHub Copilot, CLI, VS Code, Vertex AI.
- Ingyenes frissítés: Ugyanaz az ár, mint a Gemini 3 Pro, drasztikusan jobb teljesítménnyel.
- Kontextus gyorsítótárazás: Akár 75%-os költségcsökkentés ismételt kontextusok esetén.
Ellenérvek
- Preview állapot: Még csak előnézeti verzióban érhető el, nem stabil kiadásként.
- Terminal-Bench hátrány: A GPT-5.3-Codex 8,8 ponttal vezet a terminál-alapú kódolási feladatokban.
- Szakértői preferenciák: A Claude Opus 4.6-ot az emberi értékelők továbbra is jobban kedvelik szakértői feladatoknál (GDPval-AA).
- Arena ranglisták: Elmarad a Claude-tól az Arena.ai szöveges és kódolási preferencialistáin.
- Kimeneti korlát: 64 ezer kimeneti token, ami elmaradhat néhány versenytárs potenciálisan nagyobb kimenetétől.
- Google ökoszisztéma: A legmélyebb integráció a Google eszköztárán belül valósul meg.
Kinek ajánlott a Gemini 3.1 Pro?
| Ha Önnek szüksége van... | Használja a Gemini 3.1 Pro-t? |
|---|---|
| Költséghatékony csúcs-AI-ra | Igen — a legjobb ár-érték arány |
| Hosszú kontextus feldolgozására (>200k) | Igen — az 1 millió token verhetetlen |
| Produkciós kódolásra (SWE-Bench feladatok) | Igen — a 80,6% élvonalbeli |
| Szakértői szintű elemzésre és írásra | Fontolja meg a Claude Opus 4.6-ot |
| Speciális terminál-alapú kódolásra | Fontolja meg a GPT-5.3-Codex-et |
| Mély tudományos érvelésre | Fontolja meg a Gemini 3 Deep Think-et |
| Gyors, olcsó következtetésre | Fontolja meg a Gemini 3 Flash modellt |
Összegzés
A Gemini 3.1 Pro jelenleg a legjobb vétel a csúcsmodellek piacán. A benchmarkok többségében vezet, miközben töredékébe kerül a Claude Opus 4.6-nak vagy a GPT-5.2-nek. Az 1 millió tokenes kontextusablak és a konfigurálható gondolkodási szintek különösen erőssé teszik a fejlesztők és azon vállalatok számára, amelyek nagy dokumentumokat vagy kódbázisokat dolgoznak fel.
Nem tökéletes — a Claude Opus 4.6 továbbra is nyer a szakértői feladat-preferenciákban, a GPT-5.3-Codex pedig vezet a speciális kódolási benchmarkokban. De az árához képest a Gemini 3.1 Pro minden dollárért több képességet nyújt, mint bármely más ma elérhető csúcsmodell.
Ha AI-alapú alkalmazásokat épít, nézze meg, hogyan változtatja meg a vibe coding a termékfejlesztést — és hogyan hajtják az olyan modellek, mint a Gemini 3.1 Pro, az alkalmazásépítők következő generációját.