Arquitectura Cross-Platform de Plugins y Subagentes para Programación Agentica
Una serie de clases magistrales comparando OpenCode, Codex CLI (OpenAI) y Claude Code (Anthropic), basadas en documentación oficial y análisis de código fuente.
Análisis exhaustivo de las tres plataformas líderes en programación agentica
Análisis exhaustivo de los sistemas de plugins de OpenCode, Codex CLI y Claude Code: hooks, custom tools, manifests, marketplaces, MCP, LSP, monitors. Basado en documentación oficial y código fuente del SDK.
Comparativa de los sistemas de delegación en subagentes: whitelist de permisos, sandboxing OS-level, aislamiento físico con worktree, memoria persistente, routing autoritativo, background tasks, y Agent SDK.
Interacción con aplicaciones desktop mediante screenshots, mouse y teclado. Compara OpenCode (sin soporte nativo), Codex Desktop App (GA, multi-app, regional), y Claude Code (beta, MCP ecosystem, costos).
Sistemas de precios de proveedores de IA: first-party, resellers, suscripciones. Incluye el Tokenizer Trap (Opus 4.7+ usa 30-47% más tokens), costos reales por tarea, TCO empresarial, hidden costs y estrategias multi-provider.
Model Context Protocol: especificación, arquitectura Host-Client-Server, transportes (STDIO, Streamable HTTP), primitivas (tools, resources, prompts), comparativa con REST, A2A y function calling. Soporte nativo en Claude Code, OpenCode, Cursor, Windsurf. 15+ servidores destacados. Marketplaces: Glama (31,818 servers), Smithery, PulseMCP, MCP Registry.
Modelos de permiso, sandboxing OS-level, secret management, MCP security, políticas enterprise. Compara OpenCode (whitelist lógico, sin sandbox nativo), Codex CLI (Landlock/Seatbelt, 3 modos sandbox), y Claude Code (6 modos de permiso, Seatbelt/bubblewrap, worktree isolation, OpenTelemetry audit, managed settings MDM).
Estrategias de routing multi-modelo en agentes de IA: selección de provider, fallback automático, cascade pattern, cost-aware routing y speculative decoding. Compara OpenCode (75+ providers, per-agent models, plugin de fallback), Codex CLI (4 modelos nativos, providers custom, sin fallback automático), y Claude Code (aliases por provider, --fallback-model, opusplan híbrido, fast mode tiers).
Arquitectura de memoria en tres capas (corto, medio y largo plazo) para agentes de IA. Compara OpenCode (SQLite persistence, prune+full compaction, ecosistema de 10+ plugins de memoria, memex LLM Wiki), Codex CLI (JSONL sessions, Memories feature, Chronicle research preview), y Claude Code (auto memory MEMORY.md, checkpointing, SessionStore SDK, MCP memory server oficial, context window de 200K/1M tokens). Incluye análisis de prompt caching con ahorros del 41-80%.
El desafío de evaluar agentes de IA: SWE-bench (Verified, Pro, Live) y sus últimos resultados, métricas clave (pass@k, pass^k, cost per task, success rate), frameworks de evaluación (LangSmith, W&B, Arize, OpenTelemetry), Agent-as-a-Judge, y el Harness Effect (mismo modelo, distinto scaffold → hasta 16pp de diferencia). Cierre de la serie con tabla comparativa final.
Más allá del precio por token: licencias, API, infraestructura, onboarding, tokenizer traps, adaptive thinking oculto, rate limits, lock-in, y costos de oportunidad. Análisis TCO completo de OpenCode, Codex CLI y Claude Code a escala individual, startup y enterprise, con la estrategia híbrida multi-modelo que maximiza ROI.