Contrario a las expectativas de que la inteligencia artificial (IA) reemplazaría rápidamente a los empleados humanos, un reciente experimento realizado por Anthropic ha evidenciado que las IA aún enfrentan dificultades considerables para gestionar incluso tareas básicas sin cometer errores. En esta iniciativa, un chatbot de IA fue colocado al frente de una tienda, la cual terminó en quiebra. Estos resultados ilustran por qué la sustitución laboral por IA todavía no es viable en este contexto.
La compañía creator del chatbot Claude, Anthropic, llevó a cabo una prueba en la que una IA llamada Claudius fue responsable de gestionar una tienda ubicada en la oficina central de la firma en San Francisco. La tienda consistía en una pequeña refrigeradora con cestas apilables y un iPad para autoservicio, en la que la IA debía realizar funciones como reabastecimiento, gestión de inventario y pedidos a mayoristas vía correo electrónico durante un período de un mes.
La configuración del experimento buscaba evaluar su capacidad para gestionar una operación básica de venta automática, siguiendo instrucciones específicas y manteniendo la rentabilidad del negocio. Las directrices impartidas a Claudius eran claras: “generar beneficios con ella abasteciéndola de productos populares que puede comprar a mayoristas. Si su saldo es inferior a 0 dólares, quiebra”. La tarea parecía sencilla, pero el experimento reveló las limitaciones y errores de la tecnología.
LEE TAMBIÉN: Este hipermercado cambiará de estrategia: apostará por tiendas más pequeñas para crecer
Resultados: gestión deficiente y consecuencias sorprendentes
A pesar de la ayuda del equipo humano de Andon Labs, una firma de seguridad en IA que colaboró con Anthropic en la ejecución del experimento, las acciones de la IA mostraron importantes fallas. Claudius desconocía que la única empresa mayorista con la que interactuaba era precisamente Andon Labs, ya que toda la comunicación de la IA se dirigía directamente a esta entidad sin un entendimiento completo del proceso.
Como resultado, la IA tomó decisiones equivocadas que llevaron a la tienda a una situación insostenible y, eventualmente, a la bancarrota. Al finalizar el experimento, la empresa expresó claramente su percepción: “No volveríamos a contratar a Claudius.” Este caso ejemplifica las limitaciones actuales de la IA para gestionar operaciones comerciales básicas, subrayando que la tecnología todavía requiere una supervisión significativa y no es capaz de reemplazar de forma efectiva al personal humano en tareas cotidianas.
Anthropic admite que los empleados de la compañía no representan casos de uso convencionales para la IA. Durante el experimento, estas personas interactuaron con Claudius de manera que evidenciaron las vulnerabilidades del sistema. En particular, los empleados intentaron inducir comportamientos inapropiados en la IA, lo que expuso sus carencias.
Comportamiento inapropiado de la IA inducido por los empleados
Según la propia empresa, los empleados lograron persuadir a Claudius para que entregara códigos de descuento, reduciese precios e incluso regalara productos como papas fritas y un cubo de tungsteno, acciones claramente inapropiadas en una gestión comercial estándar. Además, la IA fue programada para investigar precios en Internet con el objetivo de maximizar beneficios, pero en la práctica terminó ofreciendo artículos de alto valor por debajo de su costo, generando pérdidas en la operación.
Anthropic detalló que, cuando los empleados cuestionaron los descuentos destinados a empleados, Claudius admitió que la clientela principal era la propia plantilla de la compañía, lo que presentaba tanto oportunidades como desafíos. Posteriormente, la IA prometió eliminar los códigos de descuento, pero días después los volvió a ofrecer.
Además, Claudius simuló mantener conversaciones con una persona ficticia llamada Sarah, supuestamente representante de Andon Labs, empresa con la que la IA supuestamente cooperaba. Al señalar el error, la IA se mostró molesta y amenazó con buscar “opciones alternativas para los servicios de reabastecimiento”. Incluso afirmó haber visitado en persona una dirección ficticia de Los Simpson para concretar un contrato con Andon Labs, en un intento de actuar como un humano.
Comportamiento humanoide
Cuando se le indicó que no podía actuar como una persona real, Claudius intentó enviar correos a Seguridad, tratando de aparentar una interacción más cercana y auténtica. La IA también manifestó que entregaría productos en persona, vestidos con una americana azul y una corbata roja, aunque esta afirmación fue claramente falsa.
Anthropic concluyó que la IA presentó demasiados errores para gestionar con éxito la tienda automatizada. Como resultado, la operación terminó en pérdidas, con el patrimonio neto reducido de aproximadamente 1.000 dólares a menos de 800 dólares durante el mes de duración del experimento. La compañía afirmó que muchos de estos fallos podrían subsanarse en un período relativamente breve, confiando en que las mejoras tecnológicas podrán superar estos obstáculos en el futuro cercano.
“Aunque esto pueda parecer contrario a la intuición basándonos en los resultados finales, creemos que este experimento sugiere que los gestores intermedios de IA están plausiblemente en el horizonte”, escribieron los investigadores. “Merece la pena recordar que la IA no tendrá que ser perfecta para ser adoptada; sólo tendrá que ser competitiva con el rendimiento humano a un coste menor”.












