2026-06-04Por qué las puntuaciones del 88% en MMLU hacen obsoletos los benchmarks tradicionales de IA: El cambio hacia pruebas de estrés agénticasEl problema con celebrar puntuaciones del 88% en MMLU Cuando un modelo de lenguaje alcanza...
2026-06-01El precio de 1.50 dólares de Gemini 3.5 Flash: cómo los modelos de IA fronteriza se estratifican por velocidad, no por capacidadLa ilusión de la "IA barata" ha terminado En mayo de 2026, Google lanzó Gemini 3.5 Flash c...