Agentes IA

Agentes IA que deciden y ejecutan, no solo automatizan

Agendar reunión de diseño (30 min) →

La diferencia entre automatización y agente

Tienes automatizaciones, pero la decisión sigue siendo humana — y ahí está el cuello. Tu equipo comercial pasa dos horas al día decidiendo a qué lead llamar primero. Cada PDF de proveedor lo lee una persona para extraer cuatro datos clave. ChatGPT te ayuda en una conversación, pero no puede ir a tu CRM y actualizar el deal. Quieres que cuando llegue una factura nueva alguien decida si va a aprobación o se paga directo, sin esperar a María del lunes. Tienes 30 plantillas de email para diferentes situaciones, pero el equipo no sabe cuál mandar. Has visto demos de agentes pero ninguna conectada a tu stack real.

Automatización = sigue reglas. Agente = toma decisiones

Una automatización ejecuta una regla: "si pasa X, haz Y". Un agente evalúa contexto y elige: "dado este input + este historial + este objetivo, la mejor acción es Z". La diferencia importa cuando el proceso real no se puede reducir a reglas: leer el tono de un email para saber si es urgente, decidir qué proveedor llamar primero según mix de precio/calidad/historial, redactar la respuesta a una RFP usando el material correcto.

Cuándo necesitas un agente y cuándo basta con n8n

Regla simple: si el proceso se puede dibujar como un diagrama de flujo con if/else deterministas, te basta con cuándo te basta con un workflow n8n. Si en algún nodo hay un humano "leyendo y decidiendo según criterio", probablemente necesitas agente en ese nodo. Lo más habitual: combinación. n8n para mover datos y orquestar, agente en el punto donde antes había decisión humana de criterio. Para casos avanzados de orquestación n8n con agentes IA embebidos publicamos workflows reutilizables en n8nrepo.com.

Tres niveles de autonomía

Nivel 1 (sugiere): el agente prepara la respuesta, el humano la revisa y aprueba. Útil para entrar sin riesgo y aprender la calidad real. Nivel 2 (asiste): el agente actúa pero la acción queda en draft o programada para enviar más tarde, dando ventana al humano para revertir. Nivel 3 (ejecuta): el agente actúa solo en tareas donde el coste de error es bajo y reversible (clasificar email interno, no firmar contratos). Subimos de nivel solo con datos.

Qué hacen los agentes que diseñamos

Los patrones se repiten. Estos son los cuatro grupos que cubren el 90% de los proyectos de empresas B2B con 15-150 empleados.

Agentes de clasificación

Reciben input no estructurado (correos entrantes, tickets, leads de fuentes diversas, documentos), lo clasifican con la taxonomía interna del cliente y lo enrutan al especialista correcto. Un agente bien construido clasifica 400 correos al día sin equivocarse más que un junior y opera en sub-segundo.

Agentes de extracción

Leen documentos estructurados o semi-estructurados (PDFs de facturas, contratos, formularios), extraen los campos relevantes y los cargan en el sistema destino. La clave es que funcionan con muchos formatos sin re-entrenar: una factura de Endesa y una factura de un fontónero local se leen igual.

Agentes de priorización

Analizan un dataset (pipeline comercial, backlog de producto, alertas operativas), aplican criterios de negocio (urgencia, valor, probabilidad) y producen una lista ordenada de acciones recomendadas. El agente no decide solo: prepara la decisión para que el humano valide en 30 segundos en vez de 30 minutos.

Agentes de redacción

Generan drafts de comunicación personalizada (emails comerciales, propuestas, respuestas a RFPs, resúmenes de reuniones, notas para CRM). El humano revisa y refina, no escribe desde cero. La calidad del draft suele ser 70-90% del output final, lo que recorta tiempo de redacción del orden de 5x-8x.

Para qué tipo de empresa funciona

Esto funciona si tienes volumen repetitivo de decisiones de bajo riesgo (centenares al día o más), un stack maduro donde n8n o equivalente ya mueve datos, datos históricos suficientes para evaluar baseline humano, y patrocinador interno que entiende que un agente requiere iteración los primeros 60-90 días.

No funciona si tu sector tiene riesgo regulatorio alto en automatización (decisiones que afectan derechos fundamentales: crédito, sanidad clínica, justicia), si las decisiones son únicas y no repetitivas (un agente no aprende un caso único), o si no hay datos históricos para evaluar calidad.

Cómo construimos el agente

Semana 1 — observación del proceso humano actual

Hacemos shadowing real al equipo que hoy toma esas decisiones. No basta con preguntar "qué haces"; observamos qué hace, en qué se fija, qué excepción reconoce, qué casos le cuestan. Esa observación es la base del agente. Sin ella, el agente queda mediocre.

Semana 2-4 — diseño del agente

Construimos los prompts, las herramientas que el agente puede usar, los guardarraíles de seguridad y la trazabilidad. Cada acción que el agente toma queda registrada con su razonamiento para auditoría posterior.

Semana 5-8 — pilot supervisado

El agente entra en modo nivel 1 (sugiere). El equipo aprueba/rechaza cada decisión. En paralelo medimos precision/recall comparado con el baseline humano. Iteramos prompts y reglas dos veces por semana basándonos en los rechazos del equipo.

Semana 9+ — autonomía progresiva

Cuando precision/recall superan baseline humano consistentemente, subimos al nivel 2 y eventualmente al 3 en categorías de bajo riesgo. Métricas de calidad y trazabilidad siguen activas siempre. Si calidad cae bajo umbral, alarma y vuelta a nivel anterior.

Casos reales

Empresa de software B2B en Barcelona, 110 empleados. Agente que clasifica 400 correos al día de soporte y los enruta al especialista correcto en producto/billing/integraciones/ churn. Tiempo de primera respuesta bajó de 4h a 12min. El equipo de soporte recuperó 16h/semana de clasificación manual y las redirigió a resolver tickets complejos.

Empresa industrial en Bilbao con 80 proveedores activos. Agente que extrae datos estructurados de las facturas entrantes (número, fecha, base, IVA, vencimiento, código proyecto) y las carga en el ERP español sin paso humano. 3 personas de administración recuperaron 70% de su tiempo, redirigido a análisis de costes y negociación con proveedores.

Agencia comercial en Valencia, equipo de 12 SDRs. Agente que cada mañana analiza el pipeline, prioriza los 15 leads más calientes y redacta el primer email personalizado con material relevante (cross-link agentes nativos en el CRM). El SDR valida en 30 segundos, edita si necesita y envía. Tasa de respuesta subió 38%, número de emails enviados por SDR se duplicó.

Inversión y formato

Diseño + implementación cerrada (4-9 semanas según complejidad y nivel de integración) + retainer mensual de mantenimiento, mejoras y monitorización de calidad. El retainer incluye revisión semanal de las decisiones del agente, ajuste de prompts y reglas según observaciones del equipo, y reporting mensual de métricas. Garantía: si la calidad del agente no supera el baseline humano en 60 días, devolución. Trazabilidad completa: cada decisión queda registrada con razonamiento para auditoría.

Tipos de agentes que construimos

Agentes de clasificación

Correos, tickets, leads, documentos

El agente lee el correo, el ticket o el documento entrante, lo clasifica con la taxonomía que ya usa tu equipo y lo enruta al especialista correcto sin esperar a la persona del lunes.

  • 400+ correos/día clasificados sin error humano
  • Routing al especialista correcto en segundos
  • Trazabilidad completa de cada decisión
Ver tipos →

Agentes de extracción

PDFs, facturas, contratos, formularios

El agente abre el PDF, extrae los datos clave, los normaliza al formato de tu sistema y los carga sin que nadie los toque. Funciona con 80+ proveedores distintos sin re-entrenar.

  • 80+ proveedores de facturas reconocidos
  • Normalización al formato de tu ERP
  • Validación con humano solo en outliers
Ver método →

Agentes de priorización y redacción

Pipeline comercial, propuestas, emails

El agente analiza tu pipeline cada mañana, te dice por dónde empezar, redacta el primer email personalizado y deja el deal listo para que el comercial solo apriete enviar.

  • Priorización del pipeline diaria
  • Email personalizado pre-redactado
  • Comercial valida en 30 segundos
Ver casos →

Preguntas frecuentes

¿Qué diferencia un agente de una automatización n8n?
Una automatización sigue reglas: si pasa X, haz Y. Un agente toma decisiones: lee contexto, evalúa opciones, elige la mejor según criterios. Si tu proceso se puede expresar como "si aparece la palabra factura en el asunto, mueve al canal Z", n8n basta. Si necesita "lee el correo, decide si es urgente según tono y contenido, decide a quién enrutar según especialidad", necesitas agente. La regla simple: ¿hay decisión humana de criterio en el medio? → agente.
¿Y si el agente toma una mala decisión?
Por eso construimos en tres niveles de autonomía. Nivel 1: el agente sugiere, el humano decide. Nivel 2: el agente actúa pero el humano puede revertir antes de que llegue a nadie. Nivel 3: el agente actúa solo en tareas de bajo riesgo donde el coste de error es asumible. Subimos de nivel solo después de medir calidad >= baseline humano durante 4-6 semanas. Cada decisión queda trazada para auditoría.
¿Cuál es el riesgo regulatorio?
El AI Act europeo entró en vigor en 2024 y clasifica usos por riesgo. Los agentes que diseñamos viven en categorías "uso limitado" o "uso mínimo" (operación interna, sin decisiones que afecten derechos fundamentales). Para sectores regulados (sanidad, legal, financiero), aplicamos compliance reforzado y pre-validación con tu DPO. Si el caso entra en categoría "alto riesgo", te lo decimos en el diagnóstico y no aceptamos el proyecto.
¿Cómo medís que el agente funciona mejor que un humano?
Tres métricas: precision (de las decisiones que toma, cuántas son correctas), recall (de las decisiones que debería tomar, cuántas captura), y latencia (tiempo desde input hasta acción). Establecemos baseline midiendo al equipo humano durante 2-4 semanas, después comparamos al agente contra ese baseline durante 4-8 semanas más. Pasamos a producción solo si supera baseline humano. Si no, devolvemos.
¿Mi stack tiene que cambiar?
No. El agente vive como capa sobre tus herramientas actuales (HubSpot, Slack, Notion, Google Workspace, ERPs españoles). No te pedimos migrar nada. Lo que sí necesitamos es acceso lectura/escritura a las herramientas donde el agente va a operar. La parte de seguridad y permisos se diseña con tu equipo IT en el sprint 1.
¿Cuánto cuesta?
Diseño + implementación cerrada (4-9 semanas según complejidad) + retainer mensual de mantenimiento, mejoras y monitorización de calidad. El retainer incluye revisión semanal de las decisiones del agente y ajuste de prompts/reglas. Garantía: si la calidad del agente no supera el baseline humano en 60 días, devolución. Trazabilidad completa: auditas cada decisión que toma.