Como obtenho uma chave de API do Gemini 3.1 Pro?

Acesse o Google AI Studio (aistudio.google.com), faça login com sua conta do Google e navegue até a seção de chaves de API. Você pode criar uma chave de API gratuita que fornece acesso com limite de taxa ao Gemini 3.1 Pro. Para cargas de trabalho de produção, use a API do Gemini via Google Cloud com o faturamento ativado.

Qual é o ID do modelo Gemini 3.1 Pro para chamadas de API?

Use gemini-3.1-pro-preview como o ID do modelo em suas chamadas de API. Isso funciona no SDK do Google AI (Python e Node.js), Google AI Studio, Vertex AI e na CLI do Gemini.

Quanto custa a API do Gemini 3.1 Pro?

O Gemini 3.1 Pro custa $2 por 1 milhão de tokens de entrada e $12 por 1 milhão de tokens de saída para prompts de até 200 mil tokens. Para prompts mais longos (acima de 200 mil), o preço aumenta para $4/$18. O cache de contexto reduz os custos de entrada para $0,50 por 1 milhão de tokens em cache, uma economia de 75%.

O que são níveis de pensamento (thinking levels) no Gemini 3.1 Pro?

Os níveis de pensamento (Baixo, Médio, Alto) controlam quanta computação de raciocínio o modelo usa. O nível Baixo é mais rápido e barato para tarefas simples. O Médio equilibra custo e qualidade para tarefas moderadas. O Alto usa o raciocínio máximo para depuração complexa e problemas de várias etapas. Definido através do parâmetro thinking_config nas chamadas de API.

Como funciona o cache de contexto no Gemini 3.1 Pro?

O cache de contexto permite armazenar prompts usados com frequência ou contextos de documentos nos servidores do Google. O conteúdo em cache custa $0,50 por 1 milhão de tokens (75% mais barato que a entrada padrão). Isso é ideal para aplicativos que consultam repetidamente a mesma base de código, documentação ou conjunto de dados. O tempo de vida do cache é configurável.

O Gemini 3.1 Pro pode lidar com uma base de código inteira?

Sim. Com sua janela de contexto de 1 milhão de tokens, o Gemini 3.1 Pro pode processar aproximadamente 500 arquivos de tamanho médio em uma única solicitação. Isso permite análise de toda a base de código, refatoração entre arquivos e revisão de código em nível de arquitetura sem a necessidade de fragmentação (chunking) ou aumento de recuperação (RAG).

O Gemini 3.1 Pro está disponível no GitHub Copilot?

Sim. A partir de 19 de fevereiro de 2026, o Gemini 3.1 Pro está disponível em visualização pública no GitHub Copilot, Visual Studio e Visual Studio Code. Selecione-o no seletor de modelos nas configurações do Copilot.

Construindo Apps com Gemini 3.1 Pro: Guia do Desenvolvedor para API, Codificação e Vibe Coding

Q: O que é vibe coding com Gemini 3.1 Pro?

Vibe coding é uma abordagem de desenvolvimento onde você descreve o que deseja em linguagem natural e a IA gera o código. O Gemini 3.1 Pro se destaca no vibe coding porque entende a intenção do design, não apenas a sintaxe. Ele pode traduzir descrições de produtos de alto nível em aplicativos funcionais, incluindo a geração de SVGs animados a partir de descrições de texto.

19 de fevereiro de 2026 — O Gemini 3.1 Pro acaba de ser lançado e é um dos modelos de codificação mais robustos disponíveis: 80,6% no SWE-Bench Verified, 2887 Elo no LiveCodeBench e uma janela de contexto de 1 milhão de tokens a $2 por milhão de tokens de entrada. Isso representa codificação de nível de fronteira por uma fração do custo.

Este guia é para desenvolvedores que desejam começar a construir com ele hoje mesmo. Abordaremos a configuração da API, exemplos de código em Python e Node.js, níveis de pensamento, cache de contexto para otimização de custos e como o Gemini 3.1 Pro se encaixa em fluxos de trabalho de vibe coding.

Primeiros Passos

Opção 1: Google AI Studio (Gratuito, Sem Configuração)

A maneira mais rápida de testar o Gemini 3.1 Pro:

Acesse aistudio.google.com
Faça login com sua conta do Google
Selecione Gemini 3.1 Pro Preview no menu suspenso de modelos
Comece a enviar prompts

O AI Studio é gratuito com limites de taxa — ideal para prototipagem e experimentação.

Opção 2: Chave de API (Para Construir Apps)

No AI Studio, vá em Get API Key → Create API Key
Armazene a chave com segurança (nunca a envie para o controle de versão)
Instale o SDK:

# Python
pip install google-genai

# Node.js
npm install @google/genai

Sua Primeira Chamada de API

Python

from google import genai

client = genai.Client(api_key="YOUR_API_KEY")

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="Write a Python function that finds the longest common subsequence of two strings. Include type hints and docstring."
)

print(response.text)

Node.js

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "YOUR_API_KEY" });

const response = await ai.models.generateContent({
  model: "gemini-3.1-pro-preview",
  contents: "Write a TypeScript Express middleware that validates JWT tokens and extracts user info.",
});

console.log(response.text);

Com Níveis de Pensamento (Thinking Levels)

# Pensamento Alto para depuração complexa
response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="""
    This Go server has a race condition that causes intermittent 500 errors
    under load. Here's the relevant code:

    [paste your code here]

    Find the race condition and explain the fix.
    """,
    config={
        "thinking_config": {"thinking_level": "HIGH"}
    }
)

Codificando com Gemini 3.1 Pro

Contexto de Benchmark

Antes de mergulhar nas capacidades, veja onde o Gemini 3.1 Pro se posiciona entre os modelos de codificação:

Benchmark	Gemini 3.1 Pro	GPT-5.3-Codex	Claude Opus 4.6
SWE-Bench Verified	80,6%	76,2%	72,6%
Terminal-Bench 2.0	68,5%	77,3%	—
LiveCodeBench Pro	2887 Elo	—	—

É uma melhoria de 15% em relação às melhores execuções do Gemini 3 Pro Preview, usando menos tokens de saída para produzir resultados superiores.

Geração de Código

O Gemini 3.1 Pro gera código de qualidade de produção em diversas linguagens. O contexto de 1 milhão de tokens significa que você pode incluir sua base de código existente para geração consciente do contexto:

# Carregue o contexto da sua base de código
with open("codebase_context.txt", "r") as f:
    codebase = f.read()

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents=f"""
    Here is my current codebase:

    {codebase}

    Add a new API endpoint POST /api/users/bulk-import that:
    - Accepts a CSV file upload
    - Validates each row against the User schema
    - Inserts valid records in batches of 100
    - Returns a summary of successes and failures
    - Follow the existing patterns and coding style
    """,
    config={
        "thinking_config": {"thinking_level": "MEDIUM"}
    }
)

Depuração (Debugging)

Forneça logs de erro, stack traces e código-fonte simultaneamente. O nível de pensamento "High" vale o custo extra para bugs complexos:

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="""
    Error: Connection pool exhausted after 30 seconds
    Stack trace:
    [paste stack trace]

    Relevant source files:
    [paste db.py, connection_pool.py, api_handler.py]

    This only happens under concurrent requests (>50 rps).
    Find the root cause.
    """,
    config={
        "thinking_config": {"thinking_level": "HIGH"}
    }
)

Revisão de Código

O nível de pensamento "Medium" oferece revisões equilibradas sem analisar excessivamente códigos triviais:

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents=f"""
    Review this pull request diff for:
    1. Bugs or logic errors
    2. Security vulnerabilities (SQL injection, XSS, etc.)
    3. Performance issues
    4. Adherence to project conventions

    Diff:
    {diff_content}
    """,
    config={
        "thinking_config": {"thinking_level": "MEDIUM"}
    }
)

A Vantagem do Contexto de 1M de Tokens

A janela de contexto de 1 milhão de tokens do Gemini 3.1 Pro muda a forma como você interage com o código. Em vez de enviar fragmentos, você pode carregar projetos inteiros.

Referência de Tamanho de Contexto

O Que Você Pode Carregar	Tokens Aproximados
Arquivo único (500 linhas)	~2K tokens
Projeto pequeno (50 arquivos)	~100K tokens
Projeto médio (200 arquivos)	~400K tokens
Projeto grande (500 arquivos)	~1M tokens

Análise de Toda a Base de Código

import os

def load_codebase(root_dir, extensions=('.py', '.js', '.ts', '.jsx', '.tsx')):
    """Carrega todos os arquivos fonte em uma única string de contexto."""
    files = []
    for dirpath, _, filenames in os.walk(root_dir):
        for filename in filenames:
            if any(filename.endswith(ext) for ext in extensions):
                filepath = os.path.join(dirpath, filename)
                with open(filepath, 'r', errors='ignore') as f:
                    content = f.read()
                files.append(f"=== {filepath} ===\n{content}\n")
    return "\n".join(files)

codebase = load_codebase("./src")

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents=f"""
    Analyze this entire codebase and identify:
    1. Architectural issues or anti-patterns
    2. Dead code that can be removed
    3. Functions that should be refactored
    4. Missing error handling at system boundaries

    Codebase:
    {codebase}
    """
)

Isso é algo que você simplesmente não consegue fazer com modelos de contexto de 200K sem fragmentar e perder o contexto entre arquivos.

Níveis de Pensamento: Baixo, Médio, Alto

Os níveis de pensamento permitem que você controle a relação custo-qualidade por solicitação.

Nível	Casos de Uso	Sobrecarga de Tokens	Impacto no Custo
Low (Baixo)	Autocompletar, pesquisas simples, formatação, classificação	Mínima	~1x
Medium (Médio)	Revisão de código, sumarização, análise moderada, geração de conteúdo	Moderada	~2-3x
High (Alto)	Depuração complexa, raciocínio em várias etapas, decisões de arquitetura	Significativa	~5-10x

Diretrizes Práticas

Low: "Converta este JSON em uma interface TypeScript" — nenhum raciocínio profundo é necessário.
Medium: "Revise este PR em busca de bugs e problemas de segurança" — precisa de análise, mas não exaustiva.
High: "Este sistema distribuído tem um bug de consistência intermitente sob carga. Aqui estão 15 arquivos…" — precisa de raciocínio profundo em vários arquivos.

# Alterne o nível de pensamento com base na complexidade da tarefa
def ask_gemini(prompt, complexity="medium"):
    levels = {"low": "LOW", "medium": "MEDIUM", "high": "HIGH"}

    return client.models.generate_content(
        model="gemini-3.1-pro-preview",
        contents=prompt,
        config={
            "thinking_config": {"thinking_level": levels[complexity]}
        }
    )

Otimização de Custos

Cache de Contexto

Se o seu aplicativo consulta repetidamente a mesma base de código ou documentação, o cache de contexto reduz os custos de entrada em 75%:

Preço	Padrão	Em Cache
Entrada (por 1M tokens)	$2,00	$0,50
Saída (por 1M tokens)	$12,00	$12,00

# Crie um contexto em cache para sua base de código
cached_content = client.caches.create(
    model="gemini-3.1-pro-preview",
    contents=[{"role": "user", "parts": [{"text": codebase}]}],
    ttl="3600s"  # Cache por 1 hora
)

# Consultas subsequentes usam o contexto em cache
response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="Find all SQL injection vulnerabilities in this codebase",
    cached_content=cached_content.name
)

Comparação de Custos para um Fluxo de Trabalho de Codificação

Assumindo 500K tokens de contexto de base de código + 1K de consulta, 100 consultas por dia:

Estratégia	Custo Diário
Gemini 3.1 Pro (sem cache)	~$100
Gemini 3.1 Pro (com cache)	~$27
Claude Opus 4.6 (sem cache)	~$750

Mais Dicas de Otimização

Ajuste os níveis de pensamento: Use Low para 80% das tarefas, Medium para 15% e High para 5%.
Agrupe solicitações semelhantes: Agrupe tarefas de revisão de código para amortizar o carregamento do contexto.
Faça cache agressivamente: Se você consultar os mesmos documentos/código mais de 3 vezes, coloque-os em cache.
Use o Gemini 3 Flash para tarefas simples que não exigem raciocínio de nível Pro.

Vibe Coding com Gemini 3.1 Pro

Vibe coding é a prática de descrever o que você deseja em linguagem natural e deixar a IA gerar o código. O Gemini 3.1 Pro é particularmente forte aqui porque entende a intenção do design, não apenas a sintaxe.

Como o Gemini Entende a "Vibe"

A equipe da Hostinger observou que o Gemini 3.1 Pro traduz "direção, estilo e intenção do produto" em código. Quando solicitado a criar um site de portfólio para um tema literário sombrio, ele raciocinou através do tom atmosférico para projetar uma interface correspondente.

Geração de SVG

Um recurso de destaque: o Gemini 3.1 Pro gera SVGs animados diretamente de descrições de texto. Como os SVGs são código, eles permanecem nítidos em qualquer resolução:

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="""
    Create an animated SVG logo for a tech startup called "Pulse AI".
    Design requirements:
    - Minimalist, modern style
    - Blue-to-purple gradient
    - Subtle pulse animation on the icon
    - 200x60px viewport
    - Clean, sharp edges
    """
)

# Salve o SVG diretamente
with open("logo.svg", "w") as f:
    f.write(response.text)

Construindo Aplicativos Completos

Combine a força de codificação do Gemini 3.1 Pro com um construtor de aplicativos de IA como o NxCode para ir da ideia ao aplicativo implantado:

Descreva seu app em linguagem natural.
O Gemini gera a base de código (frontend + backend + banco de dados).
Revise e itere com prompts de vibe coding.
Implante diretamente para produção.

Este fluxo de trabalho é especialmente poderoso porque a janela de contexto de 1M do Gemini pode conter toda a sua base de código em crescimento à medida que você itera.

Integração com Plataformas

GitHub Copilot

O Gemini 3.1 Pro já está disponível no GitHub Copilot:

Abra as configurações do GitHub Copilot.
Selecione Gemini 3.1 Pro no seletor de modelos.
Use conclusões in-line e chat normalmente.

CLI do Gemini

Para desenvolvimento baseado em terminal:

# Instalação
npm install -g @anthropic-ai/gemini-cli

# Uso
gemini --model gemini-3.1-pro-preview "Refactor this function to use async/await"

# Redirecionar código
cat src/server.js | gemini --model gemini-3.1-pro-preview "Review this code"

VS Code

Disponível através da extensão Copilot. Selecione Gemini 3.1 Pro no menu suspenso de modelos para sugestões in-line e chat.

Google Antigravity

A plataforma de desenvolvimento agêntico do Google com integração profunda ao Gemini. Ideal para construir agentes de IA complexos e de várias etapas que precisam de uso de ferramentas e fluxos de trabalho de longa duração.

Dicas e Melhores Práticas

Comece com pensamento Medium, escale para High apenas quando necessário — economiza de 3 a 5 vezes em tokens.
Carregue o contexto completo antecipadamente — o Gemini lida bem com 1M de tokens; não pré-filtre agressivamente.
Use cache de contexto para qualquer análise repetida (revisão de código, perguntas e respostas de documentos, geração de testes).
Seja específico sobre o formato de saída — "Retorne apenas o código, sem explicação" economiza tokens de saída.
Combine com o Gemini 3 Flash para um sistema de dois níveis: Flash para conclusões simples, Pro para raciocínio complexo.
Inclua exemplos em seus prompts — o Gemini 3.1 Pro segue bem os padrões.
Especifique explicitamente a linguagem e o framework — "Escreva em TypeScript usando Next.js 15 com App Router".
Revise o código gerado — 80,6% no SWE-Bench é impressionante, mas não é 100%. Sempre teste e revise.

Conclusão

O Gemini 3.1 Pro oferece aos desenvolvedores capacidades de codificação de nível de fronteira a preços acessíveis. A janela de contexto de 1 milhão de tokens é uma verdadeira mudança de paradigma para análise em nível de base de código, e os níveis de pensamento fornecem controle refinado sobre custo e qualidade.

Para saber mais sobre como a IA está transformando o desenvolvimento, confira nosso guia de vibe coding e a comparação entre Cursor vs Windsurf vs Claude Code. E para uma análise completa das capacidades do Gemini 3.1 Pro além da codificação, veja nosso guia completo.

Construindo Apps com Gemini 3.1 Pro: Guia do Desenvolvedor para API, Codificação e Vibe Coding (2026)