Skip to content

¿Qué es un Enrutador de IA?

El problema: Un modelo no es suficiente

Antes de los enrutadores, usar múltiples modelos de IA significaba:

  1. Crear una cuenta en OpenAI → obtener API key
  2. Crear una cuenta en Google → obtener API key
  3. Crear una cuenta en Anthropic → obtener API key
  4. Configurar cada SDK diferente
  5. Manejar billing separado para cada uno
  6. Escribir código diferente para cada API

[!TIP] Un enrutador resuelve todo esto: una sola API key, un solo endpoint, acceso a cientos de modelos.

¿Qué es un Enrutador de IA?

Un enrutador (o agregador) de IA es un servicio que actúa como intermediario entre tú y múltiples proveedores de modelos de lenguaje. Es como un “broker” de modelos.

Sin enrutador:
Tu app → OpenAI API (key 1, formato 1)
Tu app → Anthropic API (key 2, formato 2)
Tu app → Google API (key 3, formato 3)
Con enrutador:
Tu app → Enrutador (key 1, formato 1) → OpenAI
→ Anthropic
→ Google
→ 300+ modelos más

Características clave

1. API unificada

Un solo formato compatible con OpenAI para todos los modelos:

Terminal window
# Cambiar de modelo es solo cambiar el string del modelo
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-d '{"model": "openai/gpt-4o-mini", "messages": [...]}'
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-d '{"model": "anthropic/claude-sonnet-4", "messages": [...]}'
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-d '{"model": "google/gemini-2.0-flash-exp:free", "messages": [...]}'

2. Fallbacks automáticos

Si un modelo falla, el enrutador prueba el siguiente:

# Configuración de fallback
config = {
"primary": "anthropic/claude-sonnet-4",
"fallback": [
"openai/gpt-4o-mini",
"google/gemini-2.0-flash-exp:free"
]
}
# Si Claude falla → prueba GPT → prueba Gemini → error

3. Modelos gratuitos

Muchos enrutadores ofrecen modelos completamente gratuitos con rate limits:

  • Google Gemini Flash — rápido y competente
  • Meta Llama — open source de calidad
  • Mistral — modelos europeos
  • DeepSeek — razonamiento avanzado gratis

4. Un solo billing

En lugar de 5 facturas de 5 proveedores, una sola factura del enrutador.

¿Por qué deberías usar un enrutador?

Sin enrutadorCon enrutador
5+ cuentas1 cuenta
5+ API keys1 API key
5+ formatos API1 formato
5+ dashboards de billing1 dashboard
Sin fallbackFallback automático
Sin modelos gratisModelos gratis disponibles
Cambio manual de modeloCambio instantáneo

¿Cuándo NO usar un enrutador?

  • Latencia crítica: Agregar un intermediario añade ~50-200ms
  • Regulatory compliance: Datos no pueden pasar por terceros
  • Modelo específico: Si solo usas GPT-4o, no necesitas enrutador
  • Máximo control: Quieres usar la API nativa directamente

Enrutadores vs API directa: Decisión rápida

¿Usas más de 2 modelos? → Enrutador
¿Necesitas modelos gratis? → Enrutador
¿Prototipas y necesitas flexibilidad? → Enrutador
¿Necesitas latencia mínima? → API directa
¿Solo usas un modelo? → API directa
¿Datos regulatorios? → API directa (o local)

[!NOTE] Los enrutadores NO son para usar desde el navegador del chatbot. Son para desarrolladores que integran IA en aplicaciones. Si solo quieres chatear, usa las interfaces web de cada modelo (Módulo 2).

Cómo afecta el pricing

Los enrutadores cobran el precio del proveedor + un pequeño markup (generalmente 5-15%). Pero los modelos gratuitos son… gratuitos.

GPT-4o vía OpenAI: $2.50/1M input tokens (directo)
GPT-4o vía OpenRouter: $2.58/1M input tokens (+3.2% markup)
Gemini Flash Free: $0.00/1M input tokens (¡gratis!)
Llama 3.1 Free: $0.00/1M input tokens (¡gratis!)

En los próximos capítulos exploraremos los enrutadores específicos: OpenRouter, NanoBanana, y otros.