¿Qué es un Agente de IA?
De Chatbot a Agente: El salto más importante en IA
Un chatbot responde preguntas. Un agente toma acciones.
Esta distinción es fundamental. ChatGPT te dice cómo crear un archivo. Un agente lo crea por ti.
Chatbot vs Agente
| Aspecto | Chatbot | Agente |
|---|---|---|
| Qué hace | Responde texto | Ejecuta acciones |
| Herramientas | Ninguna | Terminal, browser, APIs, archivos |
| Autonomía | Ninguna — espera tu input | Parcial — decide qué hacer después |
| Memoria | Sesión actual | Persistente entre sesiones |
| Planificación | No planea | Descompone tareas en pasos |
| Ejemplo | ”Para crear un archivo, usa touch” | Crea el archivo |
| Output | Texto | Texto + acciones en el mundo real |
Anatomía de un agente
Un agente de IA tiene componentes que un chatbot no tiene:
┌─────────────────────────────────┐│ AGENTE DE IA │├─────────────────────────────────┤│ ││ 🧠 LLM (cerebro) ││ → Razona, planifica, decide ││ ││ 🛠️ Herramientas (tools) ││ → Terminal, browser, APIs ││ ││ 📝 Memoria (memory) ││ → Recuerda entre sesiones ││ ││ 📋 Skills (habilidades) ││ → Procedimientos aprendidos ││ ││ 🔄 Bucle de razonamiento ││ → Plan → Actúa → Observa ││ → → Ajusta → Repite ││ │└─────────────────────────────────┘El bucle de agentic reasoning
Un agente no solo responde — sigue un bucle:
- Recibe una tarea: “Crea un script que descargue datos de una API”
- Planifica: Necesito: buscar la API, entender el formato, escribir el script, probarlo
- Ejecuta un paso: Busca la documentación de la API
- Observa el resultado: La API devuelve JSON con estos campos…
- Ajusta el plan: OK, voy a usar estos campos en el script
- Ejecuta el siguiente paso: Escribe el script
- Observa: El script tiene un error en la línea 5
- Ajusta: Corrijo el error
- Repite hasta completar la tarea
Ejemplo real con Hermes Agent:
Tú: "Crea una API REST en Python con FastAPI que maneje una lista de tareas"
Hermes:[Plan] Voy a: 1) Crear el proyecto, 2) Escribir el código, 3) Probar que funciona
[Acción] Creando archivo main.py...[Observación] Archivo creado
[Acción] Escribiendo código...[Observación] Código escrito
[Acción] Ejecutando python main.py...[Observación] Error: ModuleNotFoundError: No module named 'fastapi'
[Acción] Instalando fastapi...[Observación] Instalado exitosamente
[Acción] Ejecutando de nuevo...[Observación] Servidor corriendo en http://localhost:8000
[Acción] Probando endpoint /todos...[Observación] Respuesta: []
✅ Tarea completada. Tu API está en main.py.Tipos de agentes
1. Agentes de código
Especializados en programación. Pueden leer, escribir y ejecutar código.
- Claude Code: Agente de Anthropic para terminal
- OpenCode: Agente open source para desarrollo
- Hermes Agent: Agente full-stack con skills, memoria y delegación
- Codex CLI: Agente de OpenAI para tareas de código
2. Agentes de investigación
Buscan información, la sintetizan y producen reportes.
- Perplexity AI: Busca y sintetiza información web
- Hermes con skills de búsqueda: Usa web_search + synthesis
3. Agentes de automatización
Conectan servicios y ejecutan workflows.
- Zapier AI: Automatización entre apps
- n8n + AI nodes: Workflows personalizados
4. Agentes multi-propósito
Pueden hacer de todo un poco.
- Hermes Agent: Código, búsqueda, archivos, terminal, APIs
- AutoGPT: Experimental, menos práctico
Herramientas típicas de un agente
| Herramienta | Qué permite | Ejemplo de uso |
|---|---|---|
| Terminal | Ejecutar comandos shell | git commit -m "fix" |
| Archivos | Leer/escribir archivos | Crear config.yaml |
| Browser | Navegar web, hacer clic | Completar formularios |
| Búsqueda | Buscar en internet | Encontrar documentación |
| APIs | Hacer request HTTP | Consultar una API |
| Memoria | Recordar entre sesiones | ”Siempre uso tabs, no spaces” |
| Delegación | Crear sub-agentes | Dividir trabajo paralelo |
Riesgos y consideraciones
[!WARNING] Los agentes pueden ejecutar comandos destructivos. Siempre:
- Revisa los comandos antes de aprobarlos (en modo interactivo)
- Nunca des acceso a producción sin safeguards
- Usa entornos aislados (containers, VMs) para pruebas
- Haz backups antes de dejar que un agente modifique archivos
El futuro es agéntico
La tendencia es clara: de chatbots que responden a agentes que actúan. En 2025, ya tenemos agentes que:
- Escriben y ejecutan código
- Navegan la web
- Manejan archivos
- Hacen deploys
- Gestionan proyectos completos
En los próximos capítulos exploramos los principales frameworks y agentes disponibles.