Google anuncia Gemini 3.1 Pro com ganhos em resolução de problemas complexos

O Google lançou em preview o modelo Gemini 3.1 Pro, que a empresa diz oferecer desempenho superior na resolução de problemas complexos para desenvolvedores e consumidores.

Em benchmarks citados na divulgação, o modelo atingiu 44.4% na Humanity’s Last Exam, contra 37.5% do Gemini 3 Pro e 34.5% do GPT 5.2. No ARC-AGI-2, que traz problemas lógicos inéditos, o desempenho saltou de 31.1% do Gemini 3 para 77.1% no 3.1 Pro.

Apesar das melhorias, o novo Gemini não liderou todos os rankings: no Arena, o Claude Opus 4.6 superou o modelo em texto com 1504 pontos, e, em avaliação de código, Opus 4.6, Opus 4.5 e GPT 5.2 High aparecem à frente. A publicação observa que o Arena se baseia em votação de usuários, o que pode privilegiar saídas que parecem corretas.

O Google destacou ganhos em geração de gráficos e simulações e relatou avanços em benchmarks de agentes, como APEX-Agents. O modelo está disponível em preview no AI Studio e no Antigravity IDE; empresas terão acesso via Vertex AI e Gemini Enterprise, e usuários verão o 3.1 Pro no app Gemini e no NotebookLM. A companhia manteve, ainda, $2 input e $12 output por 1 milhão de tokens e janelas de contexto de 1 milhão de tokens de input e 64 mil de output.

Fontes: Ars Technica