Contenido

  1. First-Party Pricing
  2. The Tokenizer Trap
  3. Cost per Task Real
  4. Resellers / Aggregators
  5. Suscripción y Créditos — OpenAI ChatGPT, Anthropic Claude, OpenCode Go, GitHub Copilot, Zencoder
  6. Hidden Costs
  7. Batch + Caching Economics
  8. TCO by Scale
  9. Comparativa de Modelos de Pago
  10. Decision Guide
  11. Fuentes Verificadas

1.First-Party Pricing — Precios Oficiales por Proveedor

Todos los precios en USD por millón de tokens. Input / Output. Datos verificados a Junio 2026 de las páginas oficiales de pricing de cada proveedor.

OpenAI API

ModeloInput / 1MOutput / 1MBatch 50%Cache ReadNotas
GPT-5.5$5.00$30.00$2.50/$15$0.50Flagship
GPT-5.4$2.50$15.00$1.25/$7.50$0.25Mejor calidad-precio
GPT-5.4 mini$0.75$4.50$0.38/$2.25$0.08Rápido, económico
GPT-5.4 nano$0.20$1.25$0.10/$0.63$0.02Máxima eficiencia
o3-deep-research$5.00$20.00N/AN/AInvestigación profunda
ℹ️ Long Context Premium: Contextos >270K tokens tienen un recargo de 1.5x–2x sobre el precio base. Cache Read = 10% del precio input.

Anthropic API

ModeloInput / 1MOutput / 1MBatch 50%Cache ReadFast Mode
Opus 4.8$5.00$25.00$2.50/$12.50$0.502x ($10/$50)
Opus 4.7$5.00$25.00$2.50/$12.50$0.506x ($30/$150)
Opus 4.6$5.00$25.00$2.50/$12.50$0.506x ($30/$150)
Sonnet 4.6$3.00$15.00$1.50/$7.50$0.30
Haiku 4.5$1.00$5.00$0.50/$2.50$0.10
⚠️ Cache Write pricing: 5 min retention = 1.25x input price ($6.25); 1h retention = 2x ($10). Cache Read = 10% del input. Stackeable con Batch.

Google Gemini API

ModeloInput / 1M (≤200K)Output / 1M (≤200K)>200K input>200K outputBatch 50%
Gemini 3.1 Pro$2.00$12.00$4.00$18.00$1/$6
Gemini 2.5 Pro$1.25$10.00$2.50$15.00$0.63/$5
Gemini 3.5 Flash$1.50$9.00$0.75/$4.50
Gemini 2.5 Flash$0.30$2.50$0.15/$1.25
Caching: Google ofrece ~90% de descuento en contexto cacheados, el mejor ratio del mercado. Batch 50% off en todos los modelos.

DeepSeek API

ModeloInput / 1MOutput / 1MCache HitBatch
V4 Flash$0.14$0.28$0.0028 / $0.28N/A
V4 Pro$0.435$0.87$0.0036 / $0.87N/A
⚠️ Nota: DeepSeek no tiene batch API ni hard cutoff — el contexto se procesa completo siempre. Cache hit en input es ~2% del precio normal (promo V4 Pro 75% descuento vigente hasta mayo 2026).

Mistral API

ModeloInput / 1MOutput / 1M
Large 3$2.00$6.00
Medium 3$0.40$2.00
Codestral$0.30$0.90
Small 3.2$0.06$0.18
💡 Nota: Mistral destaca por su eficiencia en multilingual (especialmente lenguas europeas) y su modelo Small 3.2 compite directamente con GPT-5.4 nano a la mitad del precio.

2.The Tokenizer Trap — Cuando el Precio Nominal No es el Real

🔥 CRÍTICO: El precio nominal por token NO es el precio real. La tokenización varía entre proveedores y puede encarecer el costo real hasta 1.47x. Comparar precios sin ajustar por tokenizer es engañoso.

Cada proveedor usa un tokenizer distinto. Un mismo texto en inglés genera diferente cantidad de tokens en cada plataforma. Esto significa que el costo real de una tarea puede diferir significativamente del cálculo ingenuo.

Tokenizer por Proveedor

ProveedorTokenizerBaseNotas
OpenAIo200k_baseBPE ~200K vocabGPT-5, GPT-4o, o-series
Anthropic (≤4.6)Propietario legacy~100KCompatible ±2% con cl100k
Anthropic (Opus 4.7+)Nuevo tokenizer?1.0–1.47x más tokens
GoogleSentencePiece Unigram~256KMejor en CJK
DeepSeekPropietario BPE~128K1 char EN ≈ 0.3 tok

Benchmarks Opus 4.7+ vs 4.6 (Token Ratio)

Fuentes verificadas: Simon Willison, cometkim. El nuevo tokenizer de Anthropic (Opus 4.7+) produce significativamente más tokens para el mismo texto.

ContenidoRatio 4.7 / 4.6Impacto en costo
Prosa inglés1.30–1.35x+30–35%
Código fuente1.29x+29%
System prompts1.67x+67%
Tool definitions1.36x+36%
Documentación técnica1.47x+47%
CJK (Chino/Japonés/Coreano)1.07x+7%
Imágenes1.0–3.0x+0–200%

Impacto Real en Precio

Opus 4.8 precio nominal: $5 / $25 por millón de tokens.

Para código en inglés (factor 1.29x de diferencia en tokenización entre Opus 4.7+ y GPT-5.4):

Opus 4.8 real: $6.75 / $33.75 por millón de tokens equivalentes.

vs GPT-5.4: $2.50 / $15 — nominales y reales (no hay cambio de tokenizer).

La brecha real es 2.7x más grande de lo que parece en los precios nominales.

💡 Lección: Siempre calcular el effective token rate (ETR) cuando compares proveedores: costo_real = precio_nominal × ratio_tokenización. Un modelo que parece 2x más caro puede ser 3x más caro en la práctica para tu carga de trabajo específica.

3.Cost per Task — 5 Tareas Reales Comparadas

Costos calculados con tokens reales (ajustados por tokenizer donde aplica). Sin batch ni caching.

Tarea 1: Code Review (2K input nominal, 1K output nominal)

ProveedorModeloTokens realesCosto totalTag
OpenAIGPT-5.42K / 1K$0.020REF
AnthropicOpus 4.82.7K / 1K$0.0391.95x
GoogleGemini 2.5 Pro2K / 1K$0.0131.5x más barato
DeepSeekV4 Flash2K / 1K$0.000633x más barato
DeepSeekV4 Pro2K / 1K$0.001712x más barato

Tarea 2: Refactor (50K input, 10K output)

ProveedorModeloCosto totalTag
OpenAIGPT-5.4$0.275REF
AnthropicOpus 4.8$0.5882.1x
GoogleGemini 2.5 Pro$0.1631.7x más barato
DeepSeekV4 Flash$0.01027.5x más barato

Tarea 3: Codebase Analysis (200K input, 2K output)

ProveedorModeloCosto totalTag
OpenAIGPT-5.4$0.530REF
AnthropicOpus 4.8$1.4002.6x
GoogleGemini 2.5 Pro$0.3331.6x más barato
DeepSeekV4 Flash$0.02918.3x más barato
Gana Google: Gemini 2.5 Pro con 2M de contexto nativo a $1.25/$10 (≤200K) es imbatible para análisis de codebase grandes. DeepSeek V4 Flash es 18x más barato pero sin ventana de contexto comparable.

Tarea 4: Multi-turn Conversation (10 rounds, ~15K input total + 10K output total)

ProveedorModeloCosto totalTag
OpenAIGPT-5.4$0.425REF
AnthropicOpus 4.8$0.9932.3x
GoogleGemini 2.5 Pro$0.2381.8x más barato
DeepSeekV4 Flash$0.01823.6x más barato

Tarea 5: Computer Use (20 steps con screenshots)

ProveedorModeloCosto totalTag
OpenAIGPT-5.4ConsultarN/D
AnthropicOpus 4.8$3.985REF
GoogleGemini 2.5 Pro$1.5502.6x más barato
DeepSeekV4 Flash$0.05967x más barato
⚠️ Computer Use es caro: 20 pasos con screenshots en Opus 4.8 cuestan ~$4. Una sesión de 100 pasos = ~$20. Para uso intensivo de Computer Use, Codex Desktop App (OpenAI) puede ser más económico al no tener markup por token individual.

4.Resellers / Aggregators — OpenRouter, AWS Bedrock, Azure OpenAI

OpenRouter

ConceptoDetalle
Modelo de cobroPassthrough sin markup sobre precio del provider
Fee por créditos5.5% (tarjeta) / 5% (crypto)
Rate limitsSin límites con saldo ≥$10. Por modelo por defecto
BYOK1M reqs/mes gratis, luego 5% fee
Modelos400+ modelos de todos los providers
API únicaUn solo endpoint, un solo API key
Recomendado para: Testing multi-provider, prototipado rápido, desarrolladores indie que quieren probar todos los modelos sin múltiples cuentas. Para producción con >$2K/mes conviene ir directo al provider.

AWS Bedrock

ConceptoDetalle
Pricing AnthropicMismo precio que Anthropic directo (sin markup)
Pricing open-sourceMarkup 10–70% sobre costo del provider
Región EU+10–20% sobre precio base US
Provisioned Throughput$40–200/hr reservado
Data transferCostos adicionales de salida de red (AWS egress)
ComplianceSOC2, HIPAA, VPC, PrivateLink

Azure OpenAI

ConceptoDetalle
Pricing GPTMismo precio que OpenAI directo
Global Standard21+ regiones, precio base
Data Zone+10% sobre precio base
Regional Standard2–10x más caro que Global
PTU (Provisioned Throughput Units)~$1/hr, mínimo 15 unidades
Support plans$100–$1,000+/mes adicionales
ComplianceMicrosoft Enterprise Agreement, Azure AD, HIPAA
💡 Azure PTU Warning: Las PTU se pagan aunque no se usen. Una reserva de 15 PTU a $1/hr cada una = $360/día = ~$10,800/mes mínimo. Solo para cargas predecibles y sostenidas. Para bursting, usar Global Standard.

5.Suscripciones y Modelos de Créditos

5.1 OpenAI — ChatGPT & Codex Plans

OpenAI ofrece planes de suscripción para ChatGPT/Codex que incluyen acceso a modelos, herramientas y límites de uso superiores al tier gratuito. A diferencia del pago por token de la API, estos planes ofrecen un coste fijo mensual con uso incluido dentro de límites de uso justo (fair use). El modelo Codex (agente de código) está incluido en Plus y superiores.

PlanPrecioModelos disponiblesCodexContexto razonamiento
Free$0GPT-5.5 Instant (limitado)Limitado27K
Go~$?/mesGPT-5.5 Instant (más acceso)Limitado54K
Plus~$20/mesGPT-5.5 Instant + Thinking✅ Incluido256K
Pro~$200/mesGPT-5.5 Instant + Thinking + Pro✅ Expandido400K
Business~$25-30/usuario/mesTodos + legacy✅ Incluido256K
EnterprisePersonalizadoTodos✅ Incluido400K

ℹ️ Nota: Codex (agente de código de escritorio) está disponible desde el plan Plus en adelante. Computer Use y deep research también están incluidos en Plus+. Los precios de ChatGPT Plus/Pro son orientativos — OpenAI no publica precios exactos en HTML estático (usa JavaScript); verificar en openai.com/chatgpt/pricing/.

5.2 Anthropic — Claude Plans

Anthropic ofrece suscripciones a Claude con acceso progresivo a modelos y Claude Code incluido desde el plan Pro. Los planes Max multiplican la capacidad de uso respecto a Pro. A diferencia de OpenAI, Anthropic sí publica precios exactos para todos sus planes.

PlanPrecioModelosClaude CodeFeatures clave
Free$0Sonnet, Haiku❌ NoChat web/iOS, MCP, extended thinking
Pro$20/mes ($17 anual)Opus, Sonnet, HaikuIncluidoProyectos ilimitados, Research, Cowork
Max 5×$100/mesTodos✅ Incluido5× más uso que Pro, early access
Max 20×~$200-400/mesTodos✅ Incluido20× más uso, máximo nivel
Team Standard$25/seat/mes ($20 anual)Todos✅ IncluidoSSO, admin, no training on data
Team Premium$125/seat/mes ($100 anual)Todos✅ Incluido5× más que Standard, mix & match
Enterprise$20/seat + APITodos✅ IncluidoSCIM, HIPAA, RBAC, audit logs

🔑 Clave: Claude Code está incluido en Pro ($20/mes). Para un desarrollador individual, esto puede ser más rentable que pagar API directa si se usan menos de ~400K tokens de Opus al mes o ~1M tokens de Sonnet al mes.

5.3 Suscripción vs API Pay-per-Use

La decisión entre suscripción y API depende del volumen y tipo de uso:

FactorSuscripción (ChatGPT Plus / Claude Pro)API Pay-per-Use
Costo fijo$20-200/mes$0 (solo lo que usas)
Costo marginal$0 (dentro de fair use)$0.02-3.99 por tarea
Modelo topeIncluido (GPT-5.5 Thinking / Opus)Pagas por token (más caro)
Agente códigoCodex en Plus+ / Claude Code en Pro+Pagas tokens del agente
Uso programático❌ No (solo chat web/app)✅ API, automatización, integraciones
Rate limitsFair use (no especificado)Explícitos (RPM, TPM, TPD)
Mejor paraUso interactivo diario, desarrollo ligeroProducción, automatización, alto volumen

Ejemplo real: Un desarrollador que usa Claude Code 20 días al mes, 5 sesiones/día, 4K+0.8K tokens por sesión con Sonnet 4.6 = $8.40/mes en API + overhead. Con Claude Pro ($20/mes) tiene Claude Code incluido + acceso a Opus + Cowork. La suscripción compensa si el uso es interactivo y frecuente. Para batch y automatización, la API es la única opción.

OpenCode Go

PlanPrecioIncluyeDetalle
Intro$5 (primer mes)14 modelos open-sourceCuota promocional única
Mensual$10/mes14 modelos open-sourceCuota base
Diario$12 / 5 horasModelos open-sourcePara uso esporádico
Semanal$30 / semanaModelos open-sourceUso intensivo corto
Mensual ilimitado$60 / mesModelos open-sourceUso intensivo
OverageBalance ZenPago por uso extraCargos adicionales
⚠️ Controversia: El price cut de DeepSeek V4 Pro no se ha reflejado en las cuotas de OpenCode Go. Ver issue #29008. Los suscriptores pagan tarifa plana aunque los costos del provider hayan bajado significativamente.

GitHub Copilot (AI Credits)

PlanPrecioCréditos incluidosValor nominalMax top-up
Pro$10/mes1,500 credits$15 valor$100/mes → 20K credits ($200 val)
Business$19/usuario/mesPooledPool de créditos compartido
Enterprise$39/usuario/mesPooledPool de créditos compartido
💡 1 credit = $0.01. Sin markup en modelos (mismos precios API directa). Overage configurable. Los créditos no usados expiran mensualmente.

Zencoder

PlanPrecioCréditosMultiplicadoresBYOK
Pro$45/mes30,000 créditosOpus 4.6 = 5x, Sonnet 4.6 = 3x, Haiku = 1x
Pro Max$195/mes180,000 créditosOpus 4.6 = 5x, Sonnet 4.6 = 3x, Haiku = 1x✅ (solo seat fee + API directa)
💡 BYOK en Zencoder: El plan Pro Max permite traer tu propia API key. Pagas solo el seat fee de $195/mes + el costo directo de API al provider. Ideal si ya tienes contratos enterprise con descuentos por volumen.

6.Hidden Costs — Lo Que No Está en la Tabla de Precios

🔥 Advertencia: El precio por token es solo la punta del iceberg. Los costos ocultos pueden duplicar o triplicar tu factura mensual.
Costo ocultoProveedorPrecioNotas
Web SearchOpenAI, Anthropic$10 / 1K callsCada búsqueda web que el modelo hace
Managed AgentsAnthropic$0.08 / session-hourAgentes gestionados por hora
Code ExecutionOpenAI$0.03–$1.92 / 20minPor bloque de ejecución de código
Code ExecutionAnthropic$0.05 / hr1,550 horas gratis incluidas
File SearchOpenAI$2.50 / 1K calls + $0.10/GB/díaBúsqueda + storage de vectores
Support plansAzure$100–$1,000+/mesPlanes de soporte obligatorios para PTU
Data residency EU/UKAWS, Azure, GCP+10–20%Cargo adicional por región
PTU underutilizationAzureVariablePagas igual aunque no uses la capacidad reservada
Data transfer costsAWS$0.09–$0.20/GBEgress de red entre servicios y hacia internet
Long context premiumOpenAI1.5–2x (>270K)Recargo por contexto largo
💡 Ejemplo real: Un agente que hace web search + code execution + file search puede tener una factura 3x mayor que el costo de tokens solo. En Azure, el support plan + PTU underutilization puede añadir $15K+/mes que no aparecen en la tabla de precios por token.

7.Batch + Caching Economics

ProveedorBatch descuentoCache inputCache writeStackeableAhorro máximo
OpenAI50% off10% del inputSí (Batch + Cache)~75%
Anthropic50% off10% del input1.25x (5m) / 2x (1h)~75%
Google50% off~90% descuento~95%
DeepSeekN/A~98% (cache hit)N/A~98% (cache hit rate)
Gana Google: Con 50% batch + ~90% caching, el costo efectivo de Gemini 2.5 Pro puede ser tan bajo como $0.06/$0.50 por millón de tokens. DeepSeek gana en cache hit rate (98%) pero solo aplica a input y no tiene batch.

Ejemplo: Stackeable Batch + Caching

Para una tarea de code review con 50K input (80% cacheados) en lote:

ProveedorPrecio normalBatch (50%)+ CacheCosto finalAhorro
OpenAI GPT-5.4$0.275$0.138$0.075~$0.07573%
Anthropic Opus 4.8$0.588$0.294$0.164~$0.16472%
Google Gemini 2.5 Pro$0.163$0.082$0.018~$0.01889%

8.TCO by Scale — Costo Real por Escala

Estimaciones mensuales para uso continuo (30 días) sin batch ni caching. Los costos reales serán menores con optimizaciones.

Startup: 1M tokens/día

ProveedorModeloCosto/mesTag
GoogleGemini 2.5 Pro~$510/mesMejor TCO
OpenAIGPT-5.4~$530/mesReferencia
AnthropicOpus 4.8~$1,400/mes2.6x
DeepSeekV4 Flash~$29/mes18x más barato

Scale-up: 10M tokens/día

ProveedorModeloCosto/mesTag
GoogleGemini 2.5 Pro~$5,100/mesMejor TCO
AzureGPT-5.4~$7,400/mes+10% data zone
OpenAI directGPT-5.4~$7,900/mesIncluye GPT-5.5 ocasional
AWS BedrockClaude Opus 4.8~$11,800/mes2.3x vs Google

Enterprise: 100M tokens/día

ProveedorPlataformaCosto/mesTag
GoogleVertex AI~$51K/mesMejor TCO
MicrosoftAzure OpenAI~$74K/mes+PTU
OpenAIDirect~$79K/mes+enterprise discount
AWSBedrock~$118K/mes2.3x vs Vertex

Análisis

DeepSeek V4 Flash es 18x más barato que GPT-5.4 y no escala en precio — el costo marginal por token adicional es casi nulo. Ideal para startups que priorizan budget sobre calidad.

Google Vertex AI gana en enterprise scale gracias a su caching agresivo (~90%) y batch pricing. A 100M tok/día, Vertex cuesta ~35% menos que Azure y ~55% menos que Bedrock.

Azure OpenAI es competitivo solo si ya estás en el ecosistema Microsoft (Enterprise Agreement descuenta el markup de Data Zone). Para greenfield, Vertex o directo son mejores.

9.Comparativa de Modelos de Pago

ProveedorModeloPay-per-tokenCréditosSuscripción planaBYOKFlagship / PlanLímite / Fair use
ChatGPT Plus Suscripción plana ✅ ~$20/mes GPT-5.5 Thinking incluido Fair use (no especificado)
ChatGPT Pro Suscripción plana ✅ ~$200/mes GPT-5.5 Pro incluido Fair use (5-20× Plus)
Claude Pro Suscripción plana ✅ $20/mes Opus 4.8, Sonnet, Haiku Fair use (más que Free)
Claude Max Suscripción plana ✅ $100/mes Opus 4.8, Sonnet, Haiku 5× más que Pro
OpenAI APIPay-per-tokenN/A$2.50 / $15
Anthropic APIPay-per-tokenN/A$5 / $25
OpenCode GoSuscripción plana $10/mes~$1.40 / $4.40
GitHub Copilot ProCréditos prepagos $15 $10/mes$5 / $30
Zencoder ProCréditos + BYOK 30K $45/mes Pro Max~$1,800/req (Opus)
OpenRouterPay-per-token + fee$5 / $25 + 5.5%
💡 BYOK es el modelo más flexible: Pagas al proveedor directamente (con posibles descuentos enterprise) más un fee fijo a la plataforma. Zencoder Pro Max ($195/mes seat fee + API directa) es ideal para equipos que ya tienen contratos con descuento por volumen.

10.Decision Guide — Qué Usar Según tu Perfil

💰

Budget máximo

DeepSeek V4 Flash
20x más barato que GPT-5.4

⚖️

Mejor calidad-precio

Gemini 2.5 Pro
$1.25/$10 con 2M contexto

🏭

Producción API

OpenAI GPT-5.4
Ecosistema más robusto

🔬

Multi-provider testing

OpenRouter
Una API key, 400+ modelos

👨‍💻

Developer indie

OpenCode Go
$10/mes, 14 modelos

🏛️

Enterprise compliance

AWS Bedrock o Azure
SOC2, HIPAA, VPC

📈

Heavy API (>$2K/mes)

Directo al provider
Evitar resellers y su fee

🖥️

Computer Use

Codex Desktop App
GA, sin markup por token

🔄

Fallback automático

opencode-model-fallback
Plugin de failover multi-modelo

💻

Uso interactivo diario

Suscripción (Plus/Pro) — Para uso diario como desarrollador, la suscripción a ChatGPT Plus ($20/mes) o Claude Pro ($20/mes) incluye el agente de código (Codex/Claude Code).

Compensa frente a API si haces >5 sesiones/día con modelos premium.

Estrategia Recomendada: Multi-Provider Routing

No elijas un solo proveedor. Implementa routing inteligente:

🔹 Tareas simples (chat, code review): DeepSeek V4 Flash o Gemini 2.5 Flash

🔹 Tareas complejas (refactor, análisis): Gemini 2.5 Pro o GPT-5.4

🔹 Tareas críticas (seguridad, compliance): OpenAI GPT-5.5 o Anthropic Opus 4.8 vía AWS/Azure

🔹 Computer Use: Codex Desktop App

Ahorro estimado: 40–60% vs usar un solo modelo flagship para todo.

⚠️ Cuidado con lock-in: Si usas características propietarias (Azure PTU, Bedrock Provisioned Throughput, Vertex caching), migrar de proveedor puede ser costoso y lento. Diseña tu abstracción de modelo desde el día 1 para poder cambiar de provider sin reescribir tu aplicación.

11.Conclusión — Lecciones para Navegar la Pricing War

El mercado de APIs de IA está en una guerra de precios sin precedentes. DeepSeek ha forzado a todos los proveedores a reducir precios, y la tendencia continuará. Pero el precio nominal es solo una pieza del rompecabezas.

Las tres reglas de oro del pricing de IA:

  1. Nunca compares precios nominales por token. Ajusta por tokenizer, por tarea, y por costo total (incluyendo hidden costs).
  2. Batch + caching son tus mejores amigos. Pueden reducir tu factura 75–95%. Diseña tu arquitectura para maximizar cache hits.
  3. Multi-provider routing no es opcional. Usar un solo modelo para todo es 2x–5x más caro que routing inteligente por tarea.

La plataforma que gana la guerra de precios no es la más barata por token, sino la que ofrece el mejor costo por tarea completada para tu uso específico. Para un startup, DeepSeek V4 Flash es imbatible. Para una enterprise que necesita garantías de throughput y compliance, Azure o AWS justifican su markup. Para el developer indie, OpenCode Go a $10/mes es el mejor deal del mercado.


📚 Fuentes Verificadas

Todos los precios y afirmaciones en esta clase están respaldados por documentación oficial de pricing verificada a Junio 2026.

OpenAI

Anthropic

Google

DeepSeek

Mistral

Resellers / Aggregators

Suscripciones / Créditos

Análisis y Referencias Técnicas

Última verificación: Junio 2026. Los precios y políticas pueden cambiar; consulte las fuentes oficiales para información actualizada.