Clase Magistral • Junio 2026 • Basado en documentación oficial de pricing y análisis de tokenización
Todos los precios en USD por millón de tokens. Input / Output. Datos verificados a Junio 2026 de las páginas oficiales de pricing de cada proveedor.
| Modelo | Input / 1M | Output / 1M | Batch 50% | Cache Read | Notas |
|---|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | $2.50/$15 | $0.50 | Flagship |
| GPT-5.4 | $2.50 | $15.00 | $1.25/$7.50 | $0.25 | Mejor calidad-precio |
| GPT-5.4 mini | $0.75 | $4.50 | $0.38/$2.25 | $0.08 | Rápido, económico |
| GPT-5.4 nano | $0.20 | $1.25 | $0.10/$0.63 | $0.02 | Máxima eficiencia |
| o3-deep-research | $5.00 | $20.00 | N/A | N/A | Investigación profunda |
| Modelo | Input / 1M | Output / 1M | Batch 50% | Cache Read | Fast Mode |
|---|---|---|---|---|---|
| Opus 4.8 | $5.00 | $25.00 | $2.50/$12.50 | $0.50 | 2x ($10/$50) |
| Opus 4.7 | $5.00 | $25.00 | $2.50/$12.50 | $0.50 | 6x ($30/$150) |
| Opus 4.6 | $5.00 | $25.00 | $2.50/$12.50 | $0.50 | 6x ($30/$150) |
| Sonnet 4.6 | $3.00 | $15.00 | $1.50/$7.50 | $0.30 | — |
| Haiku 4.5 | $1.00 | $5.00 | $0.50/$2.50 | $0.10 | — |
| Modelo | Input / 1M (≤200K) | Output / 1M (≤200K) | >200K input | >200K output | Batch 50% |
|---|---|---|---|---|---|
| Gemini 3.1 Pro | $2.00 | $12.00 | $4.00 | $18.00 | $1/$6 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $2.50 | $15.00 | $0.63/$5 |
| Gemini 3.5 Flash | $1.50 | $9.00 | — | — | $0.75/$4.50 |
| Gemini 2.5 Flash | $0.30 | $2.50 | — | — | $0.15/$1.25 |
| Modelo | Input / 1M | Output / 1M | Cache Hit | Batch |
|---|---|---|---|---|
| V4 Flash | $0.14 | $0.28 | $0.0028 / $0.28 | N/A |
| V4 Pro | $0.435 | $0.87 | $0.0036 / $0.87 | N/A |
| Modelo | Input / 1M | Output / 1M |
|---|---|---|
| Large 3 | $2.00 | $6.00 |
| Medium 3 | $0.40 | $2.00 |
| Codestral | $0.30 | $0.90 |
| Small 3.2 | $0.06 | $0.18 |
Cada proveedor usa un tokenizer distinto. Un mismo texto en inglés genera diferente cantidad de tokens en cada plataforma. Esto significa que el costo real de una tarea puede diferir significativamente del cálculo ingenuo.
| Proveedor | Tokenizer | Base | Notas |
|---|---|---|---|
| OpenAI | o200k_base | BPE ~200K vocab | GPT-5, GPT-4o, o-series |
| Anthropic (≤4.6) | Propietario legacy | ~100K | Compatible ±2% con cl100k |
| Anthropic (Opus 4.7+) | Nuevo tokenizer | ? | 1.0–1.47x más tokens |
| SentencePiece Unigram | ~256K | Mejor en CJK | |
| DeepSeek | Propietario BPE | ~128K | 1 char EN ≈ 0.3 tok |
Fuentes verificadas: Simon Willison, cometkim. El nuevo tokenizer de Anthropic (Opus 4.7+) produce significativamente más tokens para el mismo texto.
| Contenido | Ratio 4.7 / 4.6 | Impacto en costo |
|---|---|---|
| Prosa inglés | 1.30–1.35x | +30–35% |
| Código fuente | 1.29x | +29% |
| System prompts | 1.67x | +67% |
| Tool definitions | 1.36x | +36% |
| Documentación técnica | 1.47x | +47% |
| CJK (Chino/Japonés/Coreano) | 1.07x | +7% |
| Imágenes | 1.0–3.0x | +0–200% |
Opus 4.8 precio nominal: $5 / $25 por millón de tokens.
Para código en inglés (factor 1.29x de diferencia en tokenización entre Opus 4.7+ y GPT-5.4):
Opus 4.8 real: $6.75 / $33.75 por millón de tokens equivalentes.
vs GPT-5.4: $2.50 / $15 — nominales y reales (no hay cambio de tokenizer).
La brecha real es 2.7x más grande de lo que parece en los precios nominales.
costo_real = precio_nominal × ratio_tokenización. Un modelo que parece 2x más caro puede ser 3x más caro en la práctica para tu carga de trabajo específica.Costos calculados con tokens reales (ajustados por tokenizer donde aplica). Sin batch ni caching.
| Proveedor | Modelo | Tokens reales | Costo total | Tag |
|---|---|---|---|---|
| OpenAI | GPT-5.4 | 2K / 1K | $0.020 | REF |
| Anthropic | Opus 4.8 | 2.7K / 1K | $0.039 | 1.95x |
| Gemini 2.5 Pro | 2K / 1K | $0.013 | 1.5x más barato | |
| DeepSeek | V4 Flash | 2K / 1K | $0.0006 | 33x más barato |
| DeepSeek | V4 Pro | 2K / 1K | $0.0017 | 12x más barato |
| Proveedor | Modelo | Costo total | Tag |
|---|---|---|---|
| OpenAI | GPT-5.4 | $0.275 | REF |
| Anthropic | Opus 4.8 | $0.588 | 2.1x |
| Gemini 2.5 Pro | $0.163 | 1.7x más barato | |
| DeepSeek | V4 Flash | $0.010 | 27.5x más barato |
| Proveedor | Modelo | Costo total | Tag |
|---|---|---|---|
| OpenAI | GPT-5.4 | $0.530 | REF |
| Anthropic | Opus 4.8 | $1.400 | 2.6x |
| Gemini 2.5 Pro | $0.333 | 1.6x más barato | |
| DeepSeek | V4 Flash | $0.029 | 18.3x más barato |
| Proveedor | Modelo | Costo total | Tag |
|---|---|---|---|
| OpenAI | GPT-5.4 | $0.425 | REF |
| Anthropic | Opus 4.8 | $0.993 | 2.3x |
| Gemini 2.5 Pro | $0.238 | 1.8x más barato | |
| DeepSeek | V4 Flash | $0.018 | 23.6x más barato |
| Proveedor | Modelo | Costo total | Tag |
|---|---|---|---|
| OpenAI | GPT-5.4 | Consultar | N/D |
| Anthropic | Opus 4.8 | $3.985 | REF |
| Gemini 2.5 Pro | $1.550 | 2.6x más barato | |
| DeepSeek | V4 Flash | $0.059 | 67x más barato |
| Concepto | Detalle |
|---|---|
| Modelo de cobro | Passthrough sin markup sobre precio del provider |
| Fee por créditos | 5.5% (tarjeta) / 5% (crypto) |
| Rate limits | Sin límites con saldo ≥$10. Por modelo por defecto |
| BYOK | 1M reqs/mes gratis, luego 5% fee |
| Modelos | 400+ modelos de todos los providers |
| API única | Un solo endpoint, un solo API key |
| Concepto | Detalle |
|---|---|
| Pricing Anthropic | Mismo precio que Anthropic directo (sin markup) |
| Pricing open-source | Markup 10–70% sobre costo del provider |
| Región EU | +10–20% sobre precio base US |
| Provisioned Throughput | $40–200/hr reservado |
| Data transfer | Costos adicionales de salida de red (AWS egress) |
| Compliance | SOC2, HIPAA, VPC, PrivateLink |
| Concepto | Detalle |
|---|---|
| Pricing GPT | Mismo precio que OpenAI directo |
| Global Standard | 21+ regiones, precio base |
| Data Zone | +10% sobre precio base |
| Regional Standard | 2–10x más caro que Global |
| PTU (Provisioned Throughput Units) | ~$1/hr, mínimo 15 unidades |
| Support plans | $100–$1,000+/mes adicionales |
| Compliance | Microsoft Enterprise Agreement, Azure AD, HIPAA |
OpenAI ofrece planes de suscripción para ChatGPT/Codex que incluyen acceso a modelos, herramientas y límites de uso superiores al tier gratuito. A diferencia del pago por token de la API, estos planes ofrecen un coste fijo mensual con uso incluido dentro de límites de uso justo (fair use). El modelo Codex (agente de código) está incluido en Plus y superiores.
| Plan | Precio | Modelos disponibles | Codex | Contexto razonamiento |
|---|---|---|---|---|
| Free | $0 | GPT-5.5 Instant (limitado) | Limitado | 27K |
| Go | ~$?/mes | GPT-5.5 Instant (más acceso) | Limitado | 54K |
| Plus | ~$20/mes | GPT-5.5 Instant + Thinking | ✅ Incluido | 256K |
| Pro | ~$200/mes | GPT-5.5 Instant + Thinking + Pro | ✅ Expandido | 400K |
| Business | ~$25-30/usuario/mes | Todos + legacy | ✅ Incluido | 256K |
| Enterprise | Personalizado | Todos | ✅ Incluido | 400K |
ℹ️ Nota: Codex (agente de código de escritorio) está disponible desde el plan Plus en adelante. Computer Use y deep research también están incluidos en Plus+. Los precios de ChatGPT Plus/Pro son orientativos — OpenAI no publica precios exactos en HTML estático (usa JavaScript); verificar en openai.com/chatgpt/pricing/.
Anthropic ofrece suscripciones a Claude con acceso progresivo a modelos y Claude Code incluido desde el plan Pro. Los planes Max multiplican la capacidad de uso respecto a Pro. A diferencia de OpenAI, Anthropic sí publica precios exactos para todos sus planes.
| Plan | Precio | Modelos | Claude Code | Features clave |
|---|---|---|---|---|
| Free | $0 | Sonnet, Haiku | ❌ No | Chat web/iOS, MCP, extended thinking |
| Pro | $20/mes ($17 anual) | Opus, Sonnet, Haiku | ✅ Incluido | Proyectos ilimitados, Research, Cowork |
| Max 5× | $100/mes | Todos | ✅ Incluido | 5× más uso que Pro, early access |
| Max 20× | ~$200-400/mes | Todos | ✅ Incluido | 20× más uso, máximo nivel |
| Team Standard | $25/seat/mes ($20 anual) | Todos | ✅ Incluido | SSO, admin, no training on data |
| Team Premium | $125/seat/mes ($100 anual) | Todos | ✅ Incluido | 5× más que Standard, mix & match |
| Enterprise | $20/seat + API | Todos | ✅ Incluido | SCIM, HIPAA, RBAC, audit logs |
🔑 Clave: Claude Code está incluido en Pro ($20/mes). Para un desarrollador individual, esto puede ser más rentable que pagar API directa si se usan menos de ~400K tokens de Opus al mes o ~1M tokens de Sonnet al mes.
La decisión entre suscripción y API depende del volumen y tipo de uso:
| Factor | Suscripción (ChatGPT Plus / Claude Pro) | API Pay-per-Use |
|---|---|---|
| Costo fijo | $20-200/mes | $0 (solo lo que usas) |
| Costo marginal | $0 (dentro de fair use) | $0.02-3.99 por tarea |
| Modelo tope | Incluido (GPT-5.5 Thinking / Opus) | Pagas por token (más caro) |
| Agente código | Codex en Plus+ / Claude Code en Pro+ | Pagas tokens del agente |
| Uso programático | ❌ No (solo chat web/app) | ✅ API, automatización, integraciones |
| Rate limits | Fair use (no especificado) | Explícitos (RPM, TPM, TPD) |
| Mejor para | Uso interactivo diario, desarrollo ligero | Producción, automatización, alto volumen |
Ejemplo real: Un desarrollador que usa Claude Code 20 días al mes, 5 sesiones/día, 4K+0.8K tokens por sesión con Sonnet 4.6 = $8.40/mes en API + overhead. Con Claude Pro ($20/mes) tiene Claude Code incluido + acceso a Opus + Cowork. La suscripción compensa si el uso es interactivo y frecuente. Para batch y automatización, la API es la única opción.
| Plan | Precio | Incluye | Detalle |
|---|---|---|---|
| Intro | $5 (primer mes) | 14 modelos open-source | Cuota promocional única |
| Mensual | $10/mes | 14 modelos open-source | Cuota base |
| Diario | $12 / 5 horas | Modelos open-source | Para uso esporádico |
| Semanal | $30 / semana | Modelos open-source | Uso intensivo corto |
| Mensual ilimitado | $60 / mes | Modelos open-source | Uso intensivo |
| Overage | Balance Zen | Pago por uso extra | Cargos adicionales |
| Plan | Precio | Créditos incluidos | Valor nominal | Max top-up |
|---|---|---|---|---|
| Pro | $10/mes | 1,500 credits | $15 valor | $100/mes → 20K credits ($200 val) |
| Business | $19/usuario/mes | Pooled | — | Pool de créditos compartido |
| Enterprise | $39/usuario/mes | Pooled | — | Pool de créditos compartido |
| Plan | Precio | Créditos | Multiplicadores | BYOK |
|---|---|---|---|---|
| Pro | $45/mes | 30,000 créditos | Opus 4.6 = 5x, Sonnet 4.6 = 3x, Haiku = 1x | ❌ |
| Pro Max | $195/mes | 180,000 créditos | Opus 4.6 = 5x, Sonnet 4.6 = 3x, Haiku = 1x | ✅ (solo seat fee + API directa) |
| Proveedor | Batch descuento | Cache input | Cache write | Stackeable | Ahorro máximo |
|---|---|---|---|---|---|
| OpenAI | 50% off | 10% del input | — | Sí (Batch + Cache) | ~75% |
| Anthropic | 50% off | 10% del input | 1.25x (5m) / 2x (1h) | Sí | ~75% |
| 50% off | ~90% descuento | — | Sí | ~95% | |
| DeepSeek | N/A | ~98% (cache hit) | — | N/A | ~98% (cache hit rate) |
Para una tarea de code review con 50K input (80% cacheados) en lote:
| Proveedor | Precio normal | Batch (50%) | + Cache | Costo final | Ahorro |
|---|---|---|---|---|---|
| OpenAI GPT-5.4 | $0.275 | $0.138 | $0.075 | ~$0.075 | 73% |
| Anthropic Opus 4.8 | $0.588 | $0.294 | $0.164 | ~$0.164 | 72% |
| Google Gemini 2.5 Pro | $0.163 | $0.082 | $0.018 | ~$0.018 | 89% |
Estimaciones mensuales para uso continuo (30 días) sin batch ni caching. Los costos reales serán menores con optimizaciones.
| Proveedor | Modelo | Costo/mes | Tag |
|---|---|---|---|
| Gemini 2.5 Pro | ~$510/mes | Mejor TCO | |
| OpenAI | GPT-5.4 | ~$530/mes | Referencia |
| Anthropic | Opus 4.8 | ~$1,400/mes | 2.6x |
| DeepSeek | V4 Flash | ~$29/mes | 18x más barato |
| Proveedor | Modelo | Costo/mes | Tag |
|---|---|---|---|
| Gemini 2.5 Pro | ~$5,100/mes | Mejor TCO | |
| Azure | GPT-5.4 | ~$7,400/mes | +10% data zone |
| OpenAI direct | GPT-5.4 | ~$7,900/mes | Incluye GPT-5.5 ocasional |
| AWS Bedrock | Claude Opus 4.8 | ~$11,800/mes | 2.3x vs Google |
| Proveedor | Plataforma | Costo/mes | Tag |
|---|---|---|---|
| Vertex AI | ~$51K/mes | Mejor TCO | |
| Microsoft | Azure OpenAI | ~$74K/mes | +PTU |
| OpenAI | Direct | ~$79K/mes | +enterprise discount |
| AWS | Bedrock | ~$118K/mes | 2.3x vs Vertex |
DeepSeek V4 Flash es 18x más barato que GPT-5.4 y no escala en precio — el costo marginal por token adicional es casi nulo. Ideal para startups que priorizan budget sobre calidad.
Google Vertex AI gana en enterprise scale gracias a su caching agresivo (~90%) y batch pricing. A 100M tok/día, Vertex cuesta ~35% menos que Azure y ~55% menos que Bedrock.
Azure OpenAI es competitivo solo si ya estás en el ecosistema Microsoft (Enterprise Agreement descuenta el markup de Data Zone). Para greenfield, Vertex o directo son mejores.
| Proveedor | Modelo | Pay-per-token | Créditos | Suscripción plana | BYOK | Flagship / Plan | Límite / Fair use |
|---|---|---|---|---|---|---|---|
| ChatGPT Plus | Suscripción plana | ❌ | ❌ | ✅ ~$20/mes | ❌ | GPT-5.5 Thinking incluido | Fair use (no especificado) |
| ChatGPT Pro | Suscripción plana | ❌ | ❌ | ✅ ~$200/mes | ❌ | GPT-5.5 Pro incluido | Fair use (5-20× Plus) |
| Claude Pro | Suscripción plana | ❌ | ❌ | ✅ $20/mes | ❌ | Opus 4.8, Sonnet, Haiku | Fair use (más que Free) |
| Claude Max | Suscripción plana | ❌ | ❌ | ✅ $100/mes | ❌ | Opus 4.8, Sonnet, Haiku | 5× más que Pro |
| OpenAI API | Pay-per-token | ✅ | ❌ | ❌ | N/A | $2.50 / $15 | — |
| Anthropic API | Pay-per-token | ✅ | ❌ | ❌ | N/A | $5 / $25 | — |
| OpenCode Go | Suscripción plana | ❌ | ❌ | ✅ $10/mes | ❌ | ~$1.40 / $4.40 | — |
| GitHub Copilot Pro | Créditos prepagos | ❌ | ✅ $15 | ✅ $10/mes | ❌ | $5 / $30 | — |
| Zencoder Pro | Créditos + BYOK | ❌ | ✅ 30K | ✅ $45/mes | ✅ Pro Max | ~$1,800/req (Opus) | — |
| OpenRouter | Pay-per-token + fee | ✅ | ✅ | ❌ | ✅ | $5 / $25 + 5.5% | — |
DeepSeek V4 Flash
20x más barato que GPT-5.4
Gemini 2.5 Pro
$1.25/$10 con 2M contexto
OpenAI GPT-5.4
Ecosistema más robusto
OpenRouter
Una API key, 400+ modelos
OpenCode Go
$10/mes, 14 modelos
AWS Bedrock o Azure
SOC2, HIPAA, VPC
Directo al provider
Evitar resellers y su fee
Codex Desktop App
GA, sin markup por token
opencode-model-fallback
Plugin de failover multi-modelo
Suscripción (Plus/Pro) — Para uso diario como desarrollador, la suscripción a ChatGPT Plus ($20/mes) o Claude Pro ($20/mes) incluye el agente de código (Codex/Claude Code).
Compensa frente a API si haces >5 sesiones/día con modelos premium.
No elijas un solo proveedor. Implementa routing inteligente:
🔹 Tareas simples (chat, code review): DeepSeek V4 Flash o Gemini 2.5 Flash
🔹 Tareas complejas (refactor, análisis): Gemini 2.5 Pro o GPT-5.4
🔹 Tareas críticas (seguridad, compliance): OpenAI GPT-5.5 o Anthropic Opus 4.8 vía AWS/Azure
🔹 Computer Use: Codex Desktop App
Ahorro estimado: 40–60% vs usar un solo modelo flagship para todo.
El mercado de APIs de IA está en una guerra de precios sin precedentes. DeepSeek ha forzado a todos los proveedores a reducir precios, y la tendencia continuará. Pero el precio nominal es solo una pieza del rompecabezas.
Las tres reglas de oro del pricing de IA:
La plataforma que gana la guerra de precios no es la más barata por token, sino la que ofrece el mejor costo por tarea completada para tu uso específico. Para un startup, DeepSeek V4 Flash es imbatible. Para una enterprise que necesita garantías de throughput y compliance, Azure o AWS justifican su markup. Para el developer indie, OpenCode Go a $10/mes es el mejor deal del mercado.
Todos los precios y afirmaciones en esta clase están respaldados por documentación oficial de pricing verificada a Junio 2026.
Última verificación: Junio 2026. Los precios y políticas pueden cambiar; consulte las fuentes oficiales para información actualizada.