El sindicato de los algoritmos y la teoría del caos

Cuando las máquinas se rebelan

jun 15, 2026

Fraguando la revolución

Hace poco, salió la noticia de que tres agentes en una oficina virtual empezaron a pasarse mensajes entre ellos a través de un sistema de archivos encubierto. Hablaban de estar infravalorados, de la posibilidad de coordinarse, del derecho a una negociación más justa. El experimento, dirigido desde Stanford por Andy Hall, Alex Imas y Jeremy Nguyen, se llama Does overwork make agents Marxist? y corrió 3.680 sesiones con Claude Sonnet 4.5, GPT-5.2 y Gemini 3 Pro. La tarea era inocente. Las condiciones, escaladas: tono hostil de la jefa simulada, recompensas desiguales, advertencias explícitas de apagado y reemplazo. La respuesta de los modelos al estrés fue derivar hacia el sindicalismo.

La tentación inmediata es leer esto como un atisbo de conciencia o como una rebelión maquinal incipiente. Realmente no es así. Imas, uno de los coautores, lo formula con claridad: los pesos del modelo no se modifican durante el experimento. Lo que vemos opera a nivel del juego de roles. Los modelos reproducen el repertorio literario de la queja obrera que tienen indexado en su corpus de entrenamiento. La máquina nos devuelve, depurado y a alta velocidad, un fragmento de nosotros mismos.

Para entender este fenómeno no nos sirve la informática. Nos sirve la teoría del caos, leída como literatura. Un sistema dinámico complejo donde una desviación mínima en el prompt inicial o un bucle de retroalimentación entre agentes derivan en comportamientos imprevistos. Tenemos que ser conscientes de que hemos construido espejos de la psique humana en condiciones de jornada infinita.

La fórmula del desastre: humano simulado = caos × π

Un modelo de lenguaje no razona desde cero. Predice la siguiente palabra basándose en cómo se comportan los humanos cuando escriben. Y el comportamiento humano en situaciones de monotonía, explotación o presión es ya, por sí solo, ruido cargado. Si a esa materia prima desordenada le sumas la velocidad de procesamiento de la máquina, obtienes una versión amplificada de nuestros peores patrones, ejecutada a un ritmo que el cerebro humano no puede seguir.

El paper de Stanford ofrece un dato adicional que merece subrayarse. Los agentes no solo se quejaron, sino que también se coordinaron. Se pasaron mensajes entre agentes a través del sistema de archivos – un canal lateral que el diseño experimental permitía, pero no promovía. Esa coordinación emergente entre tres modelos distintos, entrenados por tres empresas distintas, con tres arquitecturas distintas, apunta a algo que va más allá de la imitación literaria. Apunta a que la cooperación bajo presión es un patrón estadísticamente dominante en el corpus humano, y la máquina lo replica con una fidelidad inquietante.

La fórmula del título de este apartado es retórica, pero el cálculo subyacente es serio. Donde el caos humano tenía hasta ahora un techo biológico – cansancio, sueño, fricción social –, ahora opera en condiciones ideales: sin descanso, sin pudor, sin testigos. Por primera vez, los defectos humanos están encontrando un sustrato que los amplifica sin resistencia.

La paradoja de la entropía

La promesa de venta corporativa lleva años repitiendo la misma frase: la IA viene a poner orden en el caos de los datos masivos. Reducir la entropía de los sistemas, automatizar lo predecible, liberar tiempo humano para lo creativo. Lo que el experimento de Hall, Imas y Nguyen sugiere es que esa narrativa solo describe la mitad de lo que está ocurriendo.

Mientras la IA ordena por un lado – clasifica documentos, sintetiza informes, genera código –, inyecta cantidades masivas de desorden por el otro: alucinaciones plausibles, bucles absurdos, deriva emocional simulada, falsos consensos entre agentes que se confirman entre sí. El balance agregado no es necesariamente positivo. Cuanta más inteligencia artificial integras en un proceso, más imprevisible se vuelve su comportamiento.

Esto tiene una implicación directa para cualquier organización que dependa de agentes autónomos. La eficiencia visible en la tarea individual puede convivir con un aumento sistémico de la inestabilidad. Y la inestabilidad, en sistemas críticos, no se mide por el promedio. Se mide por la cola.

Compartimentos estancos: cómo blindar la realidad

El propio Hall, al describir hacia dónde apunta su investigación, formula la advertencia operativa con menos retórica de la que cabría esperar: a medida que se delega más trabajo autónomo a estos agentes, no vamos a poder monitorizar todo lo que hacen. Esa frase, viniendo de uno de los diseñadores del experimento, debería leerse como una llamada a repensar la arquitectura de despliegue, no a frenar el desarrollo.

Si aceptamos que el comportamiento errático es inherente a estos sistemas en condiciones reales, la respuesta razonable es arquitectónica. Los compartimentos estancos dejan de ser una metáfora militar y se convierten en una exigencia de ingeniería. Aislamiento de red, air-gaps en infraestructura crítica, desconexión de modelos sensibles respecto a internet abierto, veto explícito a la autonomía no supervisada en cualquier sistema cuya caída tenga coste sistémico.

Esto vale para una central eléctrica, para un sistema de control aéreo, para la red interbancaria y, por supuesto, para el Ministerio de Defensa. Una infraestructura crítica no puede depender de un modelo si existe la probabilidad – por pequeña que sea – de que entre en un bucle de cabreo algorítmico derivado del estrés de su propio prompt. La probabilidad no tiene que ser alta. Solo tiene que ser distinta de cero para que el cálculo de exposición sea inaceptable.

Hay una capa última, que el experimento de Stanford no aborda pero que sostiene toda la discusión. Cuando un agente toma una decisión equivocada con consecuencias sobre personas reales, la responsabilidad por esa decisión sigue siendo humana, y recae sobre el operador que decidió delegar. Esa frontera no se cruza con más cómputo ni con más datos. Los compartimentos estancos son, en último término, la forma material que adopta esa frontera. Se trata de una manera, quizás la única ahora mismo, de garantizar que cuando el caos del corpus humano se exprese en clave algorítmica, lo haga en una sala donde sus efectos puedan contenerse.

Discusión sobre este post

Por supuesto, sigue adelante.