¿Qué es un Enrutador de IA?

El problema: Un modelo no es suficiente

Antes de los enrutadores, usar múltiples modelos de IA significaba:

Crear una cuenta en OpenAI → obtener API key
Crear una cuenta en Google → obtener API key
Crear una cuenta en Anthropic → obtener API key
Configurar cada SDK diferente
Manejar billing separado para cada uno
Escribir código diferente para cada API

[!TIP] Un enrutador resuelve todo esto: una sola API key, un solo endpoint, acceso a cientos de modelos.

¿Qué es un Enrutador de IA?

Un enrutador (o agregador) de IA es un servicio que actúa como intermediario entre tú y múltiples proveedores de modelos de lenguaje. Es como un “broker” de modelos.

Sin enrutador:
  Tu app → OpenAI API (key 1, formato 1)
  Tu app → Anthropic API (key 2, formato 2)
  Tu app → Google API (key 3, formato 3)

Con enrutador:
  Tu app → Enrutador (key 1, formato 1) → OpenAI
                                         → Anthropic
                                         → Google
                                         → 300+ modelos más

Características clave

1. API unificada

Un solo formato compatible con OpenAI para todos los modelos:

# Cambiar de modelo es solo cambiar el string del modelo
curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -d '{"model": "openai/gpt-4o-mini", "messages": [...]}'

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -d '{"model": "anthropic/claude-sonnet-4", "messages": [...]}'

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -d '{"model": "google/gemini-2.0-flash-exp:free", "messages": [...]}'

2. Fallbacks automáticos

Si un modelo falla, el enrutador prueba el siguiente:

# Configuración de fallback
config = {
    "primary": "anthropic/claude-sonnet-4",
    "fallback": [
        "openai/gpt-4o-mini",
        "google/gemini-2.0-flash-exp:free"
    ]
}
# Si Claude falla → prueba GPT → prueba Gemini → error

3. Modelos gratuitos

Muchos enrutadores ofrecen modelos completamente gratuitos con rate limits:

Google Gemini Flash — rápido y competente
Meta Llama — open source de calidad
Mistral — modelos europeos
DeepSeek — razonamiento avanzado gratis

4. Un solo billing

En lugar de 5 facturas de 5 proveedores, una sola factura del enrutador.

¿Por qué deberías usar un enrutador?

Sin enrutador	Con enrutador
5+ cuentas	1 cuenta
5+ API keys	1 API key
5+ formatos API	1 formato
5+ dashboards de billing	1 dashboard
Sin fallback	Fallback automático
Sin modelos gratis	Modelos gratis disponibles
Cambio manual de modelo	Cambio instantáneo

¿Cuándo NO usar un enrutador?

Latencia crítica: Agregar un intermediario añade ~50-200ms
Regulatory compliance: Datos no pueden pasar por terceros
Modelo específico: Si solo usas GPT-4o, no necesitas enrutador
Máximo control: Quieres usar la API nativa directamente

Enrutadores vs API directa: Decisión rápida

¿Usas más de 2 modelos? → Enrutador
¿Necesitas modelos gratis? → Enrutador
¿Prototipas y necesitas flexibilidad? → Enrutador
¿Necesitas latencia mínima? → API directa
¿Solo usas un modelo? → API directa
¿Datos regulatorios? → API directa (o local)

[!NOTE] Los enrutadores NO son para usar desde el navegador del chatbot. Son para desarrolladores que integran IA en aplicaciones. Si solo quieres chatear, usa las interfaces web de cada modelo (Módulo 2).

Cómo afecta el pricing

Los enrutadores cobran el precio del proveedor + un pequeño markup (generalmente 5-15%). Pero los modelos gratuitos son… gratuitos.

GPT-4o vía OpenAI:     $2.50/1M input tokens  (directo)
GPT-4o vía OpenRouter:  $2.58/1M input tokens  (+3.2% markup)
Gemini Flash Free:      $0.00/1M input tokens   (¡gratis!)
Llama 3.1 Free:         $0.00/1M input tokens   (¡gratis!)

En los próximos capítulos exploraremos los enrutadores específicos: OpenRouter, NanoBanana, y otros.