Cómo decide un agente qué hacer después (Planning vs Reactive)

No recibe una instrucción. No le explican el orden de acciones.
En esta página
  1. Planning: cuando el agente piensa por adelantado
  2. Reactive: cuando el agente actúa según la situación
  3. En qué se diferencian en la práctica
  4. En código se ve así
  5. 1) Planning: primero plan, luego ejecución
  6. 2) Reactive: paso a paso según la situación
  7. Analogía de la vida diaria
  8. Qué significa esto en la práctica
  9. En resumen
  10. FAQ
  11. Qué sigue

Cuando un agente recibe una tarea, no sabe de antemano qué pasos lo llevarán al resultado.

No recibe una instrucción. No le explican el orden de acciones.

Tiene que decidir por sí mismo qué hacer después.


Y aquí hay dos enfoques posibles.

El agente puede armar un plan por adelantado con varios pasos y avanzar con él.
O puede actuar según la situación, eligiendo el siguiente paso durante la ejecución.

Ambas variantes pueden llevar al resultado.

Pero funcionan de forma diferente.

Y justo de eso depende cómo se comporta el agente cuando algo no sale según el plan.

Diagram

Planning: cuando el agente piensa por adelantado

En este enfoque, el agente primero intenta entender qué pasos pueden llevar al resultado.

Recibe una tarea y arma un plan de acciones aproximado.

Por ejemplo:

  1. Encontrar los datos necesarios
  2. Procesarlos
  3. Formar el informe
  4. Enviar el resultado

Y solo después empieza a ejecutar los pasos uno por uno.


Este enfoque funciona bien cuando:

  • La tarea es clara
  • Los datos están disponibles
  • Y hay pocas probabilidades de que algo salga mal

El agente no toma decisiones en cada paso.
Avanza con lo que decidió por adelantado.

Reactive: cuando el agente actúa según la situación

En este enfoque, el agente no construye un plan por adelantado.

Mira la situación y elige el siguiente paso en este momento.

Por ejemplo:

  • Primero intenta obtener datos
  • Si no funciona, busca otra fuente
  • Si los datos son suficientes, pasa al procesamiento

Es decir, no decide todo el camino de una vez.

Avanza paso a paso, comprobando de forma continua:

"¿Qué cambió después de la acción anterior?"

Y con base en eso elige la siguiente.


Este enfoque es más flexible.

Si algo falla, el agente no se rompe.
Simplemente cambia la acción.

En qué se diferencian en la práctica

Agente de IA: Planning vs Reactive

El enfoque Planning intenta encontrar el camino por adelantado.
El enfoque Reactive lo busca durante el proceso.


En el primer caso, el agente dice:

"Esto es lo que haré para llegar al resultado."

En el segundo:

"Haré esto y veré qué cambia."


Planning puede ser más rápido si todo va según el plan.

Pero si algo sale mal, el plan puede romperse.
Y el agente tendrá que reconstruirlo.


Reactive actúa más lento.

Pero se adapta mejor a los cambios.

No espera que todo funcione al primer intento.

Y por eso muchas veces sigue avanzando donde un plan se detiene.

PlanningReactive
EnfoqueBusca el camino por adelantadoBusca el camino en el proceso
Cómo actúa"Esto es lo que haré""Pruebo y observo"
VelocidadMás rápido si todo funcionaMás lento
Ante errorEl plan se rompePrueba otra opción
AdaptaciónHay que rearmar el planSe adapta durante el proceso

En código se ve así

Abajo está el mismo principio en formato simple:
Planning arma primero un plan, mientras que Reactive elige el siguiente paso después de cada resultado.

Primero tenemos acciones (herramientas) que el agente puede ejecutar:

PYTHON
def search_docs(state: dict):
    return {"notes": "docs-found"}


def call_api(state: dict):
    return {"api_data": "fresh-data"}


def write_report(state: dict):
    return {"report": "ready"}


TOOLS = {
    "search_docs": search_docs,
    "call_api": call_api,
    "write_report": write_report,
}


def run_action(action: str, state: dict):
    return TOOLS[action](state)

1) Planning: primero plan, luego ejecución

Aquí el agente decide toda la ruta por adelantado:

PYTHON
state = {}
plan = ["search_docs", "call_api", "write_report"]

for action in plan:
    result = run_action(action, state)
    state.update(result)

# state -> {"notes": "...", "api_data": "...", "report": "ready"}

2) Reactive: paso a paso según la situación

Aquí el agente mira el estado después de cada paso y decide qué hacer después:

PYTHON
def choose_next_action(state: dict):
    if "notes" not in state:
        return "search_docs"
    if "api_data" not in state:
        return "call_api"
    if "report" not in state:
        return "write_report"
    return None


state = {}

while True:
    action = choose_next_action(state)
    if action is None:
        break

    result = run_action(action, state)
    state.update(result)

# state -> {"notes": "...", "api_data": "...", "report": "ready"}

En este ejemplo, ambos enfoques dan un resultado.
La diferencia está en cuándo se toma la decisión sobre el siguiente paso.

Ejemplo completo de implementación con LLM conectada

PYPython
TSTypeScript · pronto

Analogía de la vida diaria

Imagina que viajas a una ciudad nueva.

Puedes:

  • Trazar una ruta por adelantado
  • O orientarte según la situación

Planning es cuando abres el mapa y construyes la ruta hasta el final.

Sabes:

  • Dónde girar
  • Dónde parar
  • Cómo rodear un puente

Y simplemente sigues el plan.

Pero si la carretera está bloqueada, tendrás que parar y rehacer la ruta.


Reactive es cuando conduces sin un plan completo.

Ves un atasco y giras.
No encuentras una calle y eliges otra.

No conoces todo el camino por adelantado.

Pero puedes cambiar de dirección rápido si algo sale mal.


Con el agente pasa lo mismo.

Puede:

  • O armar un plan
  • O reaccionar a la situación

Y elige el enfoque según la tarea.

Qué significa esto en la práctica

Planning funciona bien cuando:

  • La tarea es clara
  • El entorno es estable
  • Y hay pocas probabilidades de que algo cambie

Reactive encaja mejor cuando:

  • Los datos pueden ser incompletos
  • Las herramientas a veces fallan
  • O la situación cambia durante la ejecución

En sistemas reales, el agente suele combinar ambos enfoques.

Puede crear un plan general, pero reaccionar si algo se desvía.

Y eso es lo que define si se detiene tras el primer error o encuentra otro camino al resultado.


En resumen

En resumen

Un agente puede:

  • Planificar varios pasos por adelantado (Planning)
  • O elegir la acción según la situación (Reactive)

Planning es más rápido si todo va según el plan.
Reactive es más flexible cuando algo cambia.

En tareas reales, el agente normalmente combina ambos enfoques.

FAQ

Q: ¿Un agente de IA planifica todos los pasos por adelantado?
A: No siempre. Puede construir un plan o elegir la siguiente acción durante la ejecución.

Q: ¿Qué es mejor: Planning o Reactive?
A: Planning es más rápido en un entorno estable, Reactive funciona mejor cuando la situación cambia.

Q: ¿El agente usa solo un enfoque?
A: En tareas reales, el agente suele combinar Planning y Reactive según la situación.

Qué sigue

Ahora ya sabes cómo el agente elige acciones.

Pero ni siquiera el mejor enfoque garantiza que siempre tome la decisión correcta.

¿Por qué?

Porque el agente funciona sobre un modelo, y el modelo tiene límites.

Y justo por esos límites, el agente puede:

  • Equivocarse
  • Pasar por alto algo importante
  • O elegir la herramienta equivocada
⏱️ 7 min de lecturaActualizado Mar, 2026Dificultad: ★★☆
Continuación práctica

Ejemplos de implementación del patrón

Continúa con la implementación usando proyectos de ejemplo.

Integrado: control en producciónOnceOnly
Guardrails para agentes con tool-calling
Lleva este patrón a producción con gobernanza:
  • Presupuestos (pasos / topes de gasto)
  • Permisos de herramientas (allowlist / blocklist)
  • Kill switch y parada por incidente
  • Idempotencia y dedupe
  • Audit logs y trazabilidad
Mención integrada: OnceOnly es una capa de control para sistemas de agentes en producción.
Autor

Esta documentación está curada y mantenida por ingenieros que despliegan agentes de IA en producción.

El contenido es asistido por IA, con responsabilidad editorial humana sobre la exactitud, la claridad y la relevancia en producción.

Los patrones y las recomendaciones se basan en post-mortems, modos de fallo e incidentes operativos en sistemas desplegados, incluido durante el desarrollo y la operación de infraestructura de gobernanza para agentes en OnceOnly.