La diferencia entre automatización y agente
Tienes automatizaciones, pero la decisión sigue siendo humana — y ahí está el cuello. Tu equipo comercial pasa dos horas al día decidiendo a qué lead llamar primero. Cada PDF de proveedor lo lee una persona para extraer cuatro datos clave. ChatGPT te ayuda en una conversación, pero no puede ir a tu CRM y actualizar el deal. Quieres que cuando llegue una factura nueva alguien decida si va a aprobación o se paga directo, sin esperar a María del lunes. Tienes 30 plantillas de email para diferentes situaciones, pero el equipo no sabe cuál mandar. Has visto demos de agentes pero ninguna conectada a tu stack real.
Automatización = sigue reglas. Agente = toma decisiones
Una automatización ejecuta una regla: "si pasa X, haz Y". Un agente evalúa contexto y elige: "dado este input + este historial + este objetivo, la mejor acción es Z". La diferencia importa cuando el proceso real no se puede reducir a reglas: leer el tono de un email para saber si es urgente, decidir qué proveedor llamar primero según mix de precio/calidad/historial, redactar la respuesta a una RFP usando el material correcto.
Cuándo necesitas un agente y cuándo basta con n8n
Regla simple: si el proceso se puede dibujar como un diagrama de flujo con if/else deterministas, te basta con cuándo te basta con un workflow n8n. Si en algún nodo hay un humano "leyendo y decidiendo según criterio", probablemente necesitas agente en ese nodo. Lo más habitual: combinación. n8n para mover datos y orquestar, agente en el punto donde antes había decisión humana de criterio. Para casos avanzados de orquestación n8n con agentes IA embebidos publicamos workflows reutilizables en n8nrepo.com.
Tres niveles de autonomía
Nivel 1 (sugiere): el agente prepara la respuesta, el humano la revisa y aprueba. Útil para entrar sin riesgo y aprender la calidad real. Nivel 2 (asiste): el agente actúa pero la acción queda en draft o programada para enviar más tarde, dando ventana al humano para revertir. Nivel 3 (ejecuta): el agente actúa solo en tareas donde el coste de error es bajo y reversible (clasificar email interno, no firmar contratos). Subimos de nivel solo con datos.
Qué hacen los agentes que diseñamos
Los patrones se repiten. Estos son los cuatro grupos que cubren el 90% de los proyectos de empresas B2B con 15-150 empleados.
Agentes de clasificación
Reciben input no estructurado (correos entrantes, tickets, leads de fuentes diversas, documentos), lo clasifican con la taxonomía interna del cliente y lo enrutan al especialista correcto. Un agente bien construido clasifica 400 correos al día sin equivocarse más que un junior y opera en sub-segundo.
Agentes de extracción
Leen documentos estructurados o semi-estructurados (PDFs de facturas, contratos, formularios), extraen los campos relevantes y los cargan en el sistema destino. La clave es que funcionan con muchos formatos sin re-entrenar: una factura de Endesa y una factura de un fontónero local se leen igual.
Agentes de priorización
Analizan un dataset (pipeline comercial, backlog de producto, alertas operativas), aplican criterios de negocio (urgencia, valor, probabilidad) y producen una lista ordenada de acciones recomendadas. El agente no decide solo: prepara la decisión para que el humano valide en 30 segundos en vez de 30 minutos.
Agentes de redacción
Generan drafts de comunicación personalizada (emails comerciales, propuestas, respuestas a RFPs, resúmenes de reuniones, notas para CRM). El humano revisa y refina, no escribe desde cero. La calidad del draft suele ser 70-90% del output final, lo que recorta tiempo de redacción del orden de 5x-8x.
Para qué tipo de empresa funciona
Esto funciona si tienes volumen repetitivo de decisiones de bajo riesgo (centenares al día o más), un stack maduro donde n8n o equivalente ya mueve datos, datos históricos suficientes para evaluar baseline humano, y patrocinador interno que entiende que un agente requiere iteración los primeros 60-90 días.
No funciona si tu sector tiene riesgo regulatorio alto en automatización (decisiones que afectan derechos fundamentales: crédito, sanidad clínica, justicia), si las decisiones son únicas y no repetitivas (un agente no aprende un caso único), o si no hay datos históricos para evaluar calidad.
Cómo construimos el agente
Semana 1 — observación del proceso humano actual
Hacemos shadowing real al equipo que hoy toma esas decisiones. No basta con preguntar "qué haces"; observamos qué hace, en qué se fija, qué excepción reconoce, qué casos le cuestan. Esa observación es la base del agente. Sin ella, el agente queda mediocre.
Semana 2-4 — diseño del agente
Construimos los prompts, las herramientas que el agente puede usar, los guardarraíles de seguridad y la trazabilidad. Cada acción que el agente toma queda registrada con su razonamiento para auditoría posterior.
Semana 5-8 — pilot supervisado
El agente entra en modo nivel 1 (sugiere). El equipo aprueba/rechaza cada decisión. En paralelo medimos precision/recall comparado con el baseline humano. Iteramos prompts y reglas dos veces por semana basándonos en los rechazos del equipo.
Semana 9+ — autonomía progresiva
Cuando precision/recall superan baseline humano consistentemente, subimos al nivel 2 y eventualmente al 3 en categorías de bajo riesgo. Métricas de calidad y trazabilidad siguen activas siempre. Si calidad cae bajo umbral, alarma y vuelta a nivel anterior.
Casos reales
Empresa de software B2B en Barcelona, 110 empleados. Agente que clasifica 400 correos al día de soporte y los enruta al especialista correcto en producto/billing/integraciones/ churn. Tiempo de primera respuesta bajó de 4h a 12min. El equipo de soporte recuperó 16h/semana de clasificación manual y las redirigió a resolver tickets complejos.
Empresa industrial en Bilbao con 80 proveedores activos. Agente que extrae datos estructurados de las facturas entrantes (número, fecha, base, IVA, vencimiento, código proyecto) y las carga en el ERP español sin paso humano. 3 personas de administración recuperaron 70% de su tiempo, redirigido a análisis de costes y negociación con proveedores.
Agencia comercial en Valencia, equipo de 12 SDRs. Agente que cada mañana analiza el pipeline, prioriza los 15 leads más calientes y redacta el primer email personalizado con material relevante (cross-link agentes nativos en el CRM). El SDR valida en 30 segundos, edita si necesita y envía. Tasa de respuesta subió 38%, número de emails enviados por SDR se duplicó.
Inversión y formato
Diseño + implementación cerrada (4-9 semanas según complejidad y nivel de integración) + retainer mensual de mantenimiento, mejoras y monitorización de calidad. El retainer incluye revisión semanal de las decisiones del agente, ajuste de prompts y reglas según observaciones del equipo, y reporting mensual de métricas. Garantía: si la calidad del agente no supera el baseline humano en 60 días, devolución. Trazabilidad completa: cada decisión queda registrada con razonamiento para auditoría.
Tipos de agentes que construimos
Agentes de clasificación
Correos, tickets, leads, documentos
El agente lee el correo, el ticket o el documento entrante, lo clasifica con la taxonomía que ya usa tu equipo y lo enruta al especialista correcto sin esperar a la persona del lunes.
- 400+ correos/día clasificados sin error humano
- Routing al especialista correcto en segundos
- Trazabilidad completa de cada decisión
Agentes de extracción
PDFs, facturas, contratos, formularios
El agente abre el PDF, extrae los datos clave, los normaliza al formato de tu sistema y los carga sin que nadie los toque. Funciona con 80+ proveedores distintos sin re-entrenar.
- 80+ proveedores de facturas reconocidos
- Normalización al formato de tu ERP
- Validación con humano solo en outliers
Agentes de priorización y redacción
Pipeline comercial, propuestas, emails
El agente analiza tu pipeline cada mañana, te dice por dónde empezar, redacta el primer email personalizado y deja el deal listo para que el comercial solo apriete enviar.
- Priorización del pipeline diaria
- Email personalizado pre-redactado
- Comercial valida en 30 segundos