Gemini 3.1 Pro täielik juhend: jõudlustestid, hinnastus, API ja kõik, mida pead teadma
19. veebruar 2026 — Google andis just välja Gemini 3.1 Pro ja see on märkimisväärne hüpe edasi. Saavutades 77,1% ARC-AGI-2 testis (rohkem kui topelt võrreldes Gemini 3 Pro 31,1%-ga), 80,6% SWE-Bench Verified testis ja 94,3% GPQA Diamond testis, on see esimene kord, kui Google on välja andnud 0,1-suuruse uuenduse – ning jõudluse kasv õigustab traditsioonide murdmist.
Parim osa? See on sama hinnaga mis Gemini 3 Pro — 2 dollarit miljoni sisendtokeni kohta. Kui kasutate juba Gemini 3 Pro-d, on see tasuta uuendus.
See juhend hõlmab kõike: mis muutus, täielikud jõudlustestide tulemused, API hinnastus, kuidas alustada, koodikirjutamise võimekus ning ausad plussid ja miinused.
Mis on Gemini 3.1 Pro?
Gemini 3.1 Pro on Google DeepMindi uusim lipulaevmudel, paiknedes kiire Gemini 3 Flashi ja teadustööle suunatud Gemini 3 Deep Think vahel. See on loodud keeruliseks arutlemiseks, mitmeetapiliseks probleemide lahendamiseks ja tootmistöödeks, mis nõuavad enamat kui pinnapealseid vastuseid.
Mis on uut võrreldes Gemini 3 Pro-ga
| Funktsioon | Gemini 3 Pro | Gemini 3.1 Pro |
|---|---|---|
| ARC-AGI-2 | 31,1% | 77,1% (+148%) |
| SWE-Bench Verified | ~68% | 80,6% (+18%) |
| GPQA Diamond | ~87% | 94,3% |
| Mõtlemistasemed | Baas | Madal / Keskmine / Kõrge |
| Väljundi efektiivsus | Baastase | Vähem tokeneid, paremad tulemused |
| Hind | $2/$12 1M kohta | $2/$12 1M kohta (sama) |
Peamine arhitektuurne parandus seisneb selles, kuidas mudel käsitleb "mõtlemistokeneid" (thinking tokens). Gemini 3.1 Pro kasutab arutlemist tõhusamalt, vajades vähem väljundtokeneid, pakkudes samas usaldusväärsemaid tulemusi. JetBrainsi tehisintellekti direktor Vladislav Tankov kirjeldas seda kui "tugevamat, kiiremat… ja tõhusamat".
Jõudlustestide süvaanalüüs
Google teatab, et Gemini 3.1 Pro juhib 13-s 16-st hinnatud jõudlustestist. Siin on täielik võrdlus:
Arutlemine ja teadus
| Jõudlustest | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|---|
| ARC-AGI-2 | 77,1% | 37,6% | 54,2% | 31,1% |
| GPQA Diamond | 94,3% | 91,3% | 92,4% | ~87% |
| Humanity's Last Exam (ilma tööriistadeta) | 44,4% | 41,2% | 34,5% | 37,5% |
| Humanity's Last Exam (tööriistadega) | 51,4% | 53,1% | — | — |
| MMMMU-Pro | 75,8% | — | — | — |
Koodikirjutamine
| Jõudlustest | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.3-Codex | Gemini 3 Pro |
|---|---|---|---|---|
| SWE-Bench Verified | 80,6% | 72,6% | 76,2% | ~68% |
| LiveCodeBench Pro | 2887 Elo | — | — | — |
| Terminal-Bench 2.0 | 68,5% | — | 77,3% | — |
| SWE-Bench Pro (Avalik) | 54,2% | — | 56,8% | — |
Agendipõhised ülesanded
| Jõudlustest | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 |
|---|---|---|---|
| APEX-Agents | 33,5% | 29,8% | 23,0% |
| Long-Context MRCR v2 (128k) | 84,9% | 84,9% (viik) | — |
Kus iga mudel võidab
- Gemini 3.1 Pro: Arutlemine (ARC-AGI-2), teadus (GPQA), agendipõhised ülesanded (APEX), SWE-Bench Verified, hinna ja jõudluse suhe.
- Claude Opus 4.6: Ekspertülesannete eelistused (GDPval-AA Elo: 1606 vs 1317), 'Humanity's Last Exam' tööriistadega, Arena koodikirjutamise edetabel.
- GPT-5.3-Codex: Terminal-Bench 2.0, SWE-Bench Pro — spetsialiseeritud koodikirjutamise testid.
Lisateabe saamiseks Claude'i ja GPT võrdluse kohta vaadake meie GPT-5.3 Codex vs Claude Opus 4.6 koodikirjutamise võrdlust.
API hinnastus ja paketid
Gemini 3.1 Pro säilitab Gemini 3 Pro-ga identse hinnastuse – massiivne jõudluse uuendus ilma lisakuludeta.
API hinnastus
| Tase | Sisend (1M tokeni kohta) | Väljund (1M tokeni kohta) |
|---|---|---|
| Kuni 200K kontekst | $2.00 | $12.00 |
| Üle 200K kontekst | $4.00 | $18.00 |
| Konteksti vahemälu (hitt) | $0.50 | $12.00 |
Kulude võrdlus
| Mudel | Sisend (1M kohta) | Väljund (1M kohta) | Suhteline kulu |
|---|---|---|---|
| Gemini 3.1 Pro | $2.00 | $12.00 | 1x (baastase) |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 1.5x / 1.25x |
| Claude Opus 4.6 | $15.00 | $75.00 | 7.5x / 6.25x |
| GPT-5.2 | ~$10.00 | ~$30.00 | 5x / 2.5x |
Tellimuspaketid
| Pakett | Hind | Mida sisaldab |
|---|---|---|
| Tasuta (AI Studio) | $0 | Piiratud mahuga API ligipääs |
| Google AI Pro | $19.99/kuu | Täielik ligipääs 3.1 Pro-le, Deep Research, 1M kontekst |
| Google AI Ultra | $124.99/kuu | Kõik eelmises + Deep Think, Veo 3.1 Fast, kõrgeimad limiidid |
Kuidas Gemini 3.1 Pro-d kasutada
Google AI Studio (Kiireim algus)
- Minge lehele Google AI Studio
- Valige mudelite rippmenüüst Gemini 3.1 Pro Preview
- Alustage päringute tegemist – tasuta koos kasutuspiirangutega
API ligipääs (Python)
from google import genai
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="Explain the architectural differences between microservices and monoliths",
config={
"thinking_config": {"thinking_level": "MEDIUM"}
}
)
print(response.text)
API ligipääs (Node.js)
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "YOUR_API_KEY" });
const response = await ai.models.generateContent({
model: "gemini-3.1-pro-preview",
contents: "Write a Python function to merge two sorted arrays efficiently",
});
console.log(response.text);
Muud platvormid
- Gemini CLI:
gemini --model gemini-3.1-pro-preview "your prompt" - GitHub Copilot: Valige mudelivalikust Gemini 3.1 Pro
- VS Code: Saadaval Copiloti laienduse kaudu
- Vertex AI: Ettevõtte tasemel töökoormuste jaoks koos teenustaseme lepingutega (SLA)
- Google Antigravity: Google'i agendipõhine arendusplatvorm
Koodikirjutamise võimekus
Gemini 3.1 Pro on tipptasemel koodikirjutamise mudel. Jõudlustestid räägivad enda eest:
- SWE-Bench Verified: 80,6% — lahendab reaalseid GitHubi probleeme otsast lõpuni.
- LiveCodeBench Pro: 2887 Elo — võistlusliku koodikirjutamise tase.
- 15% parandust võrreldes parimate Gemini 3 Pro Preview tulemustega.
Mida see suudab
Koodi genereerimine: Kirjutab täielikke funktsioone, mooduleid ja rakendusi kirjelduste põhjal. 1M tokeni suurune kontekst tähendab, et see suudab mõista teie tervet koodibaasi enne uue koodi loomist.
Silumine (Debugging): Söötke sellele vealoge, veajälgi (stack traces) ja asjakohaseid lähtekoodifaile. "Kõrge" (High) mõtlemistasemega suudab see süstemaatiliselt analüüsida keerulisi mitme failiga seotud vigu.
Koodi ülevaatus (Code Review): "Keskmisel" (Medium) mõtlemistasemel pakub see tasakaalustatud koodiülevaatust – leides vead ilma lihtsate muudatuste üleliigse analüüsita.
Loov koodikirjutamine: Gemini 3.1 Pro suudab disaini kavatsuse koodiks tõlkida. Hostinger märkis, et mudel "mõistab kasutaja päringu taga olevat fiilingut", genereerides koodi, mis peegeldab stiili ja toote eesmärki, mitte ainult süntaksit.
SVG genereerimine: Silmapaistev võimekus – see genereerib tekstikirjelduste põhjal veebivalmis animeeritud SVG-sid. Kuna need on puhas kood, püsivad need teravad igas resolutsioonis.
Kus see jääb alla
GPT-5.3-Codex juhib endiselt Terminal-Bench 2.0 (77,3% vs 68,5%) ja SWE-Bench Pro (56,8% vs 54,2%) testides. Väga spetsiifiliste koodikirjutamise ülesannete puhul, mis nõuavad sügavat terminali interaktsiooni, on OpenAI Codex mudelid endiselt ees.
Koodikirjutamise võimekuse üksikasjalikuks võrdluseks vaadake meie Cursor vs Windsurf vs Claude Code võrdlust.
1 miljoni tokeni suurune kontekstiaken
1 miljoni tokeni suurune sisendkontekst on Gemini 3.1 Pro üks suurimaid eeliseid. Perspektiivi loomiseks:
| Sisu tüüp | Ligikaudne suurus |
|---|---|
| Keskmine romaan | ~100K tokenit |
| Suur koodibaas (500 faili) | ~500K tokenit |
| Täielik juriidiliste lepingute komplekt | ~200K tokenit |
| Teadustööde kogumik (20 tööd) | ~400K tokenit |
Kasutusvaldkonnad
- Koodibaasi analüüs: Laadige üles terve repo ja küsige küsimusi arhitektuuri kohta, leidke faile üleseid vigu või planeerige refaktoreerimist.
- Dokumenditöötlus: Analüüsige pikki lepinguid, vastavusdokumente või teadustöid.
- Mitmeetapiline uurimistöö: Säilitage mahukas vestluse kontekst ilma varasemat infot kaotamata.
- Ristviitamine: Analüüsige mitut dokumenti korraga, et leida vastuolusid või seoseid.
Claude Opus 4.6 toetab 200 000 tokenit – see on märkimisväärne, kuid Gemini 1M annab sellele viiekordse eelise pika kontekstiga ülesannetes. Mõlemad saavutasid MRCR v2 testis (128K keskmine) 84,9%, mis viitab sarnasele kvaliteedile jagatud kontekstivahemikus.
Mõtlemistasemed: Madal, Keskmine, Kõrge
Gemini 3.1 Pro tutvustab konfigureeritavaid mõtlemistasemeid (thinking levels), mis võimaldavad kontrollida arutlusprotsessi sügavust päringu kohta:
| Tase | Parim... | Arutluse sügavus | Mõju kulule |
|---|---|---|---|
| Madal | Autocomplete, lihtsad otsingud, klassifitseerimine | Minimaalne | Madalaim |
| Keskmine | Koodi ülevaatus, kokkuvõtted, mõõdukas analüüs | Tasakaalustatud | Standardne |
| Kõrge | Keeruline silumine, mitmeetapiline arutlus, uurimistöö | Sügav | Kõrgeim |
Kuidas seadistada mõtlemistaset
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="Debug this race condition in my Go server...",
config={
"thinking_config": {"thinking_level": "HIGH"}
}
)
See on praktiline tööriist kulude optimeerimiseks. Iga päring ei vaja maksimaalset arutlemist – kasutades lihtsate ülesannete jaoks "Madalat" ja keeruliste jaoks "Kõrget" taset, saate API kulusid märkimisväärselt vähendada.
Plussid ja miunused
Plussid
- Parim hinna ja jõudluse suhe: Juhib enamikku jõudlusteste hinnaga $2/$12 miljoni tokeni kohta – sisendi osas 7,5 korda odavam kui Opus 4.6.
- 1M tokeni suurune kontekst: Suurim seeriatootmises olev kontekstiaken tippmudelite seas.
- ARC-AGI-2 domineerimine: 77,1% arutlusskoor, mis on enam kui topelt võrreldes eelmiste Gemini mudelitega.
- Tugev koodikirjutamine: 80,6% SWE-Bench Verified, konkureerib parimatega.
- Mõtlemistasemed: Täpne kontroll kulu ja arutlussügavuse üle.
- Lai kättesaadavus: AI Studio, API, GitHub Copilot, CLI, VS Code, Vertex AI.
- Tasuta uuendus: Sama hind mis Gemini 3 Pro-l koos drastiliselt parema jõudlusega.
- Konteksti vahemällu salvestamine: Kuni 75% kulusääst korduvate kontekstide puhul.
Miinused
- Preview-staatus: Endiselt eelvaate faasis, mitte veel üldiselt kättesaadav stabiilne versioon.
- Terminal-Bench lõhe: GPT-5.3-Codex juhib 8,8 punktiga terminalipõhistes koodikirjutamise ülesannetes.
- Ekspertide eelistused: Claude Opus 4.6 on endiselt inimhindajate eelistus ekspertülesannetes (GDPval-AA).
- Arena edetabelid: Jääb Claude'ile alla Arena.ai teksti ja koodikirjutamise eelistuste tabelites.
- Väljundi limiit: 64 000 väljundtokenit vs potentsiaalselt suuremad väljundid mõnel konkurendil.
- Google'i ökosüsteem: Sügavaim integratsioon on Google'i enda tööriistahelas.
Kes peaks Gemini 3.1 Pro-d kasutama?
| Kui vajate... | Kas kasutada Gemini 3.1 Pro-d? |
|---|---|
| Eelarvesõbralikku tippmudelit | Jah — parim hinna ja jõudluse suhe |
| Pika konteksti töötlemist (>200K) | Jah — 1M tokenit on ületamatu |
| Tootmiskõlblikku koodikirjutamist | Jah — 80,6% on tippklass |
| Eksperttaseme analüüsi ja kirjutamist | Kaaluge Claude Opus 4.6 |
| Spetsialiseeritud terminalikoodi | Kaaluge GPT-5.3-Codex |
| Sügavat teaduslikku arutlemist | Kaaluge Gemini 3 Deep Think |
| Kiiret ja odavat järeldamist | Kaaluge Gemini 3 Flash |
Kokkuvõte
Gemini 3.1 Pro on hetkel parima väärtusega tippmudel tehisintellekti turul. See juhib enamikku jõudlusteste, makstes samal ajal murdosa Claude Opus 4.6 või GPT-5.2 hinnast. 1 miljoni tokeni suurune kontekstiaken ja konfigureeritavad mõtlemistasemed muudavad selle eriti tugevaks arendajatele ja ettevõtetele, kes töötlevad suuri dokumente või koodibaase.
See ei ole täiuslik – Claude Opus 4.6 võidab endiselt ekspertülesannete eelistustes ja GPT-5.3-Codex juhib spetsiifilistes koodikirjutamise testides. Kuid oma hinna juures pakub Gemini 3.1 Pro rohkem võimekust iga dollari kohta kui ükski teine täna saadaval olev tippmudel.
Kui ehitate tehisintellektil põhinevaid rakendusi, vaadake, kuidas vibe coding muudab toodete arendamist – ja kuidas sellised mudelid nagu Gemini 3.1 Pro toetavad järgmise põlvkonna rakenduste loojaid.