IA LabIA LabComparadorEn vivo
IA para los que no programan · Observatorio de modelos
Datos de demostración

Los modelos de IA más poderosos.
Y cuánto valen de verdad.

Texto, imagen, voz, música y video: quién manda en cada categoría, qué cuesta cada modelo y dónde está el sweet spot entre precio e inteligencia. Sin humo: benchmarks independientes, actualizados cada día a las 6:00 am.

19
Modelos evaluados
5
Categorías
Invalid Date
Última actualización
Más poderoso
GPT-4o
OpenAI
Inteligencia96
Valor85
Precio$5
Mejor valor
Claude 3.5 Sonnet
Anthropic
Inteligencia94
Valor92
Precio$3
$
Más barato
sin datos
#ModeloInteligencia (Índice AA)PrecioValor
01
GPT-4o
OpenAI · Arena #1 · 1315
96
$5USD / 1M tokens85
Más poderosoSweet Spot
02
Claude 3.5 Sonnet
Anthropic · Arena #2 · 1290
94
$3USD / 1M tokens92
Mejor valorSweet Spot
03
Gemini 1.5 Pro
Google · Arena #3 · 1265
91
$3.5USD / 1M tokens78
04
Llama 3.1 405B
Meta · Arena #5 · 1240
88
$1.5USD / 1M tokens95
Sweet Spot
05
Mistral Large 2
Mistral · Arena #6 · 1220
86
$2USD / 1M tokens82

//Precio vs. inteligencia

Cada punto es un modelo. Arriba a la izquierda = mucha inteligencia por poco dinero: la zona sweet spot.

ZONA SWEET SPOT9794918885$1.36$2.74$5.51Precio (USD, escala logarítmica) →Inteligencia ↑GPT-4oClaude 3.5 SonnetLlama 3.1 405B

//Metodología

Transparencia total: así se construye este ranking.

+¿De dónde salen los datos?

Las puntuaciones de inteligencia y calidad provienen de Artificial Analysis, el evaluador independiente de referencia: para texto usamos su Índice de Inteligencia (0–100, combina los benchmarks más exigentes) y para imagen, voz, música y video el Elo de sus arenas, donde miles de personas votan a ciegas entre resultados de dos modelos. Los precios de texto provienen de la misma fuente (USD por millón de tokens, mezcla 3:1 entrada/salida); los de las demás categorías son tarifas de lista oficiales de cada proveedor, revisadas por el equipo de IA Lab. Como segunda fuente independiente, validamos texto, imagen y video contra el leaderboard público de LMArena: cuando un modelo aparece en su top 10, mostramos su Elo de Arena junto al creador.

+¿Cómo se calcula el Valor?

El Valor responde una sola pregunta: ¿cuánta inteligencia recibes por cada dólar? La fórmula es calidad² ÷ √precio, reescalada para que el mejor equilibrio de cada categoría sea 100. Elevar la calidad al cuadrado premia a los modelos realmente buenos (no gana el más mediocre solo por ser regalado) y la raíz del precio evita que un modelo carísimo se hunda si su calidad lo justifica. El sello Sweet spot se otorga a los modelos eficientes: nadie ofrece más calidad por menos dinero (frontera de Pareto) y su Valor es alto.

+Unidades de precio por categoría

Texto: USD por 1 millón de tokens (mezcla 3:1) · Imagen: USD por imagen (~1024 px) · Voz: USD por 1 millón de caracteres · Música: USD por canción (~3 min) · Video: USD por segundo generado. Son tarifas de lista de las API oficiales; los proveedores pueden cambiarlas y algunos modelos solo se ofrecen por suscripción (se indica el equivalente estimado).