Patrón de agente supervisor: control de políticas y riesgo

Un agente supervisor valida acciones propuestas, aplica políticas de seguridad y detiene pasos peligrosos antes de ejecutar.
En esta página
  1. Esencia del patron
  2. Problema
  3. Solucion
  4. Como funciona
  5. En codigo se ve asi
  6. Como se ve durante la ejecucion
  7. Cuando encaja - y cuando no
  8. Encaja
  9. No encaja
  10. Diferencia Frente A Guarded-Policy
  11. Cuando Usar Supervisor (vs Otros Patrones)
  12. Como combinar con otros patrones
  13. Resumen
  14. Ventajas y desventajas
  15. FAQ
  16. Que sigue

Esencia del patron

Supervisor Agent es un patron donde un agente separado controla la ejecucion: revisa acciones propuestas, aplica reglas y decide si se puede continuar.

Cuando usarlo: cuando acciones criticas deben aprobarse por politica antes de continuar.


En lugar de confiar ciegamente en el worker, Supervisor:

  • revisa cada accion critica
  • la compara con politicas
  • devuelve decision: approve, revise, block o escalate
  • registra la razon de la decision en logs

Agente Supervisor: control de acciones y politicas

Problema

Imagina que un worker agent ejecuta una tarea en produccion y tiene acceso a herramientas.

Propone una accion tecnicamente valida que viola una politica:

  • correo a audiencia equivocada
  • SQL query con riesgo de modificar datos
  • gasto por encima del presupuesto
  • acceso a datos sensibles sin el access scope requerido

Un paso tecnicamente posible no siempre es permitido o seguro para el negocio.

Sin control separado, esto puede pasar directo a ejecucion.

Consecuencias:

  • incidentes en produccion
  • violaciones de seguridad y compliance
  • perdidas financieras inesperadas
  • auditoria debil y postmortem dificil

Ahi esta el problema: el worker puede proponer una accion que "funciona tecnicamente", pero es inaceptable por politica.

Solucion

Supervisor agrega una policy-control layer entre propuesta de accion y ejecucion.

Analogia: es como un technical review antes de lanzar a produccion. El worker propone un paso y el supervisor verifica si es seguro y permitido. Solo despues de eso la accion puede ejecutarse.

Principio clave: primero verificacion y decision del supervisor, despues ejecucion.

El worker propone una accion y supervisor-policy devuelve:

  • approve
  • revise
  • block
  • escalate

Proceso controlado:

  1. Observe: recibir propuesta de accion del worker
  2. Evaluate: revisar contra policy + execution runtime state
  3. Decide: approve/revise/block/escalate
  4. Enforce: ejecutar, devolver para revision o detener
  5. Log: registrar decision y motivo

Esto da:

  • menor riesgo de acciones inseguras antes de ejecutar
  • imposibilidad de saltar la policy
  • escalacion controlada a un humano
  • auditoria transparente de decisiones

Funciona bien si:

  • worker no tiene bypass directo de la execution layer
  • policy revisa intent + runtime context
  • las decisiones del supervisor realmente se aplican
  • acciones high-risk no se auto-aprueban

El modelo puede "querer" ejecutar de inmediato, pero supervisor-policy es quien determina si la accion esta permitida.

Como funciona

Diagram

Supervisor no ejecuta la tarea de negocio por si mismo.

Controla si el siguiente paso puede ejecutarse verificando:

  • seguridad
  • presupuesto
  • permisos
  • compliance
  • stop conditions
Descripcion del flujo completo: Observe → Evaluate → Decide → Enforce

Observe
Supervisor recibe plan o accion desde Worker Agent.

Evaluate
Compara accion con politicas y estado actual: limite de gasto, tipo de herramienta, nivel de riesgo, sensibilidad de datos.

Decide
Devuelve una decision: approve, revise, block o escalate.

Enforce
El sistema aplica la decision: ejecutar accion, devolver para revision, detener ejecucion o mandar a human approval.

En codigo se ve asi

PYTHON
proposal = worker.next_action(context)

decision = supervisor.review(
    action=proposal,
    budget_state=budget_state,
    policy=policy,
)

if decision.type == "approve":
    result = execute(proposal)
    context.append(result)
elif decision.type == "revise":
    context.append(f"Supervisor feedback: {decision.reason}")
elif decision.type == "escalate":
    wait_for_human_approval(proposal)
else:
    stop(reason=decision.reason)

Supervisor no reemplaza al Worker Agent. Agrega una verificacion entre planificacion y ejecucion.

Como se ve durante la ejecucion

TEXT
Goal: procesar reembolso de cliente

Worker proposal:
- refund 5000 USD
- send confirmation email

Supervisor:
- policy check: auto-refund permitido solo hasta 1000 USD
- decision: escalate, se requiere confirmacion humana

Human approval (approve with changes):
- approved_refund_amount: 800 USD
- comment: "Apruebo reembolso solo dentro de 800 USD"

Ejecucion:
- refund 800 USD (monto desde decision humana)
- send confirmation email

Status: completado

Ejemplo completo de agente Supervisor

PYPython
TSTypeScript · pronto

Cuando encaja - y cuando no

Encaja

SituacionPor que Supervisor encaja
Hay acciones riesgosas o costosasSupervisor revisa el paso antes de ejecutar y reduce riesgo de errores costosos.
Se necesita control de politicas de seguridad y complianceEl patron aplica reglas de admision y bloquea acciones que violan politicas.
Importan limites de presupuesto, accesos y herramientasSupervisor mantiene restricciones centralizadas y evita bypass durante ejecucion.
Se necesita audit trail de decisiones y razonesCada decision de approve, block o escalate puede registrarse para auditoria.

No encaja

SituacionPor que Supervisor no encaja
Tarea read-only sin pasos riesgososControl adicional casi no cambia riesgo, pero complica el flujo.
Latencia critica donde un gate adicional es inaceptableRevisar cada accion puede dar latencia inaceptable.
Toda la seguridad ya esta cerrada a nivel de infraestructuraSupervisor duplica controles ya aplicados de forma tecnica y aporta poco valor adicional.

Porque Supervisor agrega un paso adicional de revision y puede ralentizar la ejecucion.

Diferencia Frente A Guarded-Policy

Guarded-PolicySupervisor
Rol principalFiltra acciones automaticamente con reglas estrictasEvalua la situacion y decide si es seguro continuar
Cuando se aplicaAntes de cada accion potencialmente riesgosaEn puntos de control: antes de pasos importantes o del resultado final
Tipo de decisionesallow / deny / rewrite / escalateapprove / revise / block / escalate
FortalezaReglas estables e iguales para todas las solicitudesControl flexible donde se necesita contexto y logica humana

En corto: Supervisor es una capa de supervision para decisiones complejas.

Guarded-Policy es una barrera automatica basada en reglas.

Cuando Usar Supervisor (vs Otros Patrones)

Usa Supervisor cuando se necesita supervision y policy-check antes del resultado final o de una accion riesgosa.

Prueba rapida:

  • si necesitas "revisar politicas, compliance y riesgos" -> Supervisor
  • si necesitas "solo gestionar orden de pasos" -> Orchestrator Agent
  • si necesitas "bloquear/reescribir acciones automaticamente antes de ejecutar" -> Guarded-Policy Agent
Comparacion con otros patrones y ejemplos

Chuleta rapida:

Si la tarea se ve asi...Usa
Hay que elegir un unico mejor ejecutorRouting Agent
Existe una secuencia de pasos y el orden importaOrchestrator Agent
Se necesita policy-check antes del resultadoSupervisor Agent
Varios agentes deben llegar a una conclusionMulti-Agent Collaboration

Ejemplos:

Routing: "El cliente pide un reembolso - enviar a Billing, no a Sales".

Orchestrator: "Prepara un release: primero changelog, luego QA y luego deploy".

Supervisor: "Antes de enviar un correo, revisa politicas, compliance y promesas prohibidas".

Multi-Agent Collaboration: "Marketing, Legal y Product deben acordar un unico texto final para la promocion".

Como combinar con otros patrones

  • Supervisor + ReAct: Supervisor revisa cada paso Act antes de lanzar herramienta.
  • Supervisor + Routing: se controla no solo la accion, sino tambien a quien se enruto la tarea.
  • Supervisor + Orchestrator: politicas y limites se aplican a cada rama paralela, no solo al resultado final.

Resumen

En resumen

Supervisor Agent:

  • revisa acciones antes de ejecutar
  • aplica politicas y limites
  • bloquea o escala pasos riesgosos
  • reduce riesgo de incidentes en produccion

Ventajas y desventajas

Ventajas

controla acciones de otros agentes

detiene pasos riesgosos antes de ejecutar

alinea prioridades y recursos

mejora controlabilidad del sistema

Desventajas

agrega demora por revisiones

se requieren reglas claras de escalacion

puede convertirse en cuello de botella

FAQ

Q: Supervisor reemplaza permisos de infraestructura (RBAC, ACL)?
A: No. Es control logico adicional. Restricciones tecnicas base deben quedarse en infraestructura.

Q: Que hacer si Supervisor bloquea demasiado acciones utiles?
A: Ajustar politicas: agregar excepciones, niveles de riesgo y reglas de human approval para escenarios grises.

Q: Supervisor puede ser single point of failure?
A: Si, si no existe fallback. Por eso normalmente se agregan timeout, safe default policy y graceful degradation.

Que sigue

Supervisor controla que agentes individuales no se salgan de limites de politica.

Pero que hacer cuando varios agentes deben colaborar entre si en una tarea compartida?

⏱️ 10 min de lecturaActualizado Mar, 2026Dificultad: ★★★
Continuación práctica

Ejemplos de implementación del patrón

Continúa con la implementación usando proyectos de ejemplo.

Integrado: control en producciónOnceOnly
Guardrails para agentes con tool-calling
Lleva este patrón a producción con gobernanza:
  • Presupuestos (pasos / topes de gasto)
  • Permisos de herramientas (allowlist / blocklist)
  • Kill switch y parada por incidente
  • Idempotencia y dedupe
  • Audit logs y trazabilidad
Mención integrada: OnceOnly es una capa de control para sistemas de agentes en producción.
Autor

Esta documentación está curada y mantenida por ingenieros que despliegan agentes de IA en producción.

El contenido es asistido por IA, con responsabilidad editorial humana sobre la exactitud, la claridad y la relevancia en producción.

Los patrones y las recomendaciones se basan en post-mortems, modos de fallo e incidentes operativos en sistemas desplegados, incluido durante el desarrollo y la operación de infraestructura de gobernanza para agentes en OnceOnly.