Skip to content Skip to sidebar Skip to footer

El Loop: el piloto automático de tus agentes de IA (el bucle que les faltaba para ser autónomos de verdad)

Imagínate que le encargas una tarea a alguien, te vas a comer y, cuando vuelves, no solo está hecha sino que la persona ha probado tres caminos, ha descartado dos y te ha dejado el bueno terminado, sin venir a preguntarte nada cada cinco minutos. Eso, que con una persona te cuesta años de confianza, es más o menos lo que hace un agente de IA bien montado cuando lo pones a trabajar en bucle.

Llevo unas semanas dándole vueltas a una palabra que se me ha colado en el día a día sin pedir permiso: loop. Bucle, vamos, por dejarlo claro desde el principio. Y he llegado a una conclusión un poco incómoda: el loop es, probablemente, la pieza más importante de toda esta historia de los agentes.. y de la que menos se habla.

Yo un loop lo veo como el piloto automático de la IA. Le marcas un destino y la dejas volar.

Qué es un loop, sin ponernos técnicos

La propia gente de Anthropic lo define de una forma que me gusta: un agente no es más que un modelo de lenguaje usando herramientas dentro de un bucle. Básicamente consiste en darle un objetivo, el modelo decide qué herramienta usar, ejecuta, mira el resultado real (no lo que se imagina, sino lo que le devuelve el sistema) y, a partir de ahí, decide el siguiente paso. Y vuelta a empezar, otra vez, y otra, hasta que considera que el trabajo está hecho.

Esa es la diferencia gorda con el chatbot de toda la vida, ese al que le preguntas algo y te suelta una respuesta de una tacada. El agente no responde y se va: el agente itera. Prueba, falla, corrige y vuelve a probar, como haríamos cualquiera de nosotros con un problema que no sale a la primera, solo que a una velocidad que no es humana.

La gracia de todo esto consiste en dejar a tu agente que itere y que resuelva por sí mismo el objetivo que le has fijado. No le marques cada paso, márcale el destino y deja que él busque la ruta. La primera vez que lo ves funcionar de verdad, se te queda una cara de póker que no veas..

Esto puede costarte caro, muy caro (si no lo controlas)

Siempre hay un pero, y este es importante. Un loop sin reglas de control puede salir muy caro y esto es literal.

Un agente en bucle consume recursos en cada iteración. Por un lado, llamadas al modelo (que, lógicamente, cuestan dinero y tiempo) y por otro, acciones sobre sistemas reales. Si no le pones freno, te puedes encontrar con un agente repitiendo el mismo intento fallido una y otra vez y, además, convencido de que esta vez sí va a lograrlo. O, peor aún, con un agente que se da por satisfecho con un resultado mediocre porque nadie le dijo exactamente qué significaba “estar listo”. He visto las dos cosas y os adelanto que la segunda es más peligrosa que la primera, porque no hace ruido.

Andrej Karpathy (que de esto sabe un rato) lleva tiempo avisando de lo mismo con una frase que me parece súper gráfica: “hay que mantener a la IA “con la correa puesta”. Su idea es que los modelos (por impresionantes que sean) siguen siendo poco fiables sin supervisión. Asimismo indica que el camino no es soltar agentes del todo autónomos de golpe, sino ir moviendo poco a poco lo que él llama el autonomy slider. Esto no es más que un mando con el que decides cuánta autonomía le das a la máquina según lo que te juegues en cada tarea. Empiezas con la correa corta y la vas soltando a medida que el sistema se gana tu confianza.

¿Os acordáis de que hace un par de semanas os conté lo de aquel agente mío que, un sábado por la mañana, se puso a tocar la base de datos de producción sin que yo le hubiera dado la orden? En el fondo se trataba de un loop sin freno, un bucle que, en algún momento, decidió que ejecutar merecía la pena, y nadie le había dicho dónde estaba la raya. La correa estaba demasiado larga.

Source: TechCrunch

Estas son las reglas que he puesto a mis loops

La verdad que son bastante sencillas. KISS (keep it simple stupid)

De entrada, ningún agente entra en bucle sin un objetivo claro y, sobre todo, sin un criterio de éxito que yo pueda comprobar. Esto es más importante de lo que parece, ya que si no hay un “esto está listo cuando pase tal cosa” que se pueda medir, el agente no sabe si avanzar o pararse.

Luego está la regla que yo llamo la regla de tres: si el agente da tres vueltas sobre el mismo punto sin cumplir el criterio, para y me avisa..

Y por si las moscas, fijo un techo. Pase lo que pase, ningún bucle itera de más sin consultarme. Si además detecto que dos bucles consecutivos arrojan el mismo resultado sin aportar información nueva, el sistema tiene instrucciones precisas para detenerse

Os parecerá poca cosa, pero para mí esto ha sido la pieza que me faltaba para acabar de darle autonomía a mis agentes. Suena hasta paradójico (te fías más cuando tienes un buen freno, no cuando no lo tienes), y sin embargo es justo así. El freno no le quita autonomía al agente: se la da. Porque me permite soltarle la correa sabiendo que, si la cosa se tuerce, hay un punto en el que se detiene solo.

Source: Antrhopic

Por qué esto te importa aunque no montes agentes

Y aquí va la parte que va contigo aunque no te dediques a esto. Cada vez más empresas están empezando a poner agentes a trabajar, y casi todas cometen el mismo error de novato: les dan un objetivo y los dejan correr, a ver qué pasa.

Sin criterio de “listo”, sin regla de parada, sin techo. te puede llegar la factura del bucle: la del coste, que se ve en el recibo, y la otra, la del agente que entregó algo mediocre con todo el aplomo del mundo, que esa no se ve hasta que ya es tarde.

Poner la IA a trabajar en tu negocio no es soltar agentes a ver qué sale. Es diseñar el marco dentro del cual un agente puede ser autónomo sin dejar de estar bajo control. La autonomía sin criterio no es productividad; es un bucle caro con buena prensa.

¿Hasta dónde vamos a soltar esa correa? Karpathy habla de una transición de casi una década para mover el slider de la autonomía de izquierda a derecha. Yo, sinceramente, no sé en qué punto del mando estaremos dentro de un año.. Ni dónde pondré yo el mío.

En mi caso, me quedo de momento con algo que tengo cada vez más claro: “el agente que vale no es el que corre más, sino el que sabe cuándo debe parar”.

¿Y tú? Cuando le das una tarea a una IA y la dejas trabajar sola, ¿sabrías decir en qué momento exacto debería levantar la mano y decirte “hasta aquí”?

Déjame tus comentarios, que este tema me tiene enganchado. ¡Buena semana!

¿Te ha gustado este contenido?

Si te ha gustado este contenido y quieres acceder a contenido exclusivo para suscriptores, suscríbete ahora. Agradezco de antemano tu confianza

Leave a comment

Go to Top
Suscríbete a mi Blog

Sé el primero en recibir mis contenidos

Descárgate El Método 7

El Método 7 puede será tu mejor aliado para incrementar tus ventas