AI Tech News

WELCOME

Artigos mais recentes

Perspectivas atualizadas diariamente.

Quando Todo Modelo Marca 88%: Por Que a Saturação de Benchmarks Está Quebrando a Avaliação de IA
Technology

Quando Todo Modelo Marca 88%: Por Que a Saturação de Benchmarks Está Quebrando a Avaliação de IA

O Problema Que Ninguém Queria Admitir Modelos de fronteira agora marcam 88% no MMLU, aproximando-se do teto estimado de especialistas humanos de 89,8%. Esse é o...

7 min read

Dados rastreados

Índice de Inteligência IA — 3 Modelos Fronteira

Ver todos os conjuntos de dados
01531466105-1706-0106-08Claude Opus 4.7 (Adaptive Reasoning, Max Effort) — Anthropic: 57 (2026-05-17)Claude Opus 4.8 (Adaptive Reasoning, Max Effort) — Anthropic: 61 (2026-06-01)Claude Opus 4.8 (Adaptive Reasoning, Max Effort) — Anthropic: 61 (2026-06-08)61GPT-5.5 (xhigh) — OpenAI: 60 (2026-05-17)GPT-5.5 (xhigh) — OpenAI: 60 (2026-06-01)GPT-5.5 (xhigh) — OpenAI: 60 (2026-06-08)60Gemini 3.1 Pro Preview — Google DeepMind: 57 (2026-05-17)Gemini 3.1 Pro Preview — Google DeepMind: 57 (2026-06-01)Gemini 3.1 Pro Preview — Google DeepMind: 57 (2026-06-08)57
  • Anthropic
  • OpenAI
  • Google DeepMind

Intelligence Index — Trend

Passe o cursor sobre cada ponto para ver a versão específica do modelo naquela data.

Última atualização: 2026-06-08 · 3 pontos de dados · artificialanalysis.ai

Últimas notícias

Ver tudo