Diario TI
IA

Anthropic cuestiona la orden de EE.UU. que bloquea Fable 5 y Mythos 5

La empresa sostiene que la medida se originó por una técnica limitada para eludir las salvaguardas de Fable 5. Anthropic cumplirá la orden, pero discrepa de su fundamento técnico y pide un procedimiento más transparente.

Anthropic anunció la suspensión mundial del acceso a sus modelos Fable 5 y Mythos 5, en cumplimiento de una directiva de control de exportaciones emitida por el Gobierno de Estados Unidos.

En una declaración publicada el 12 de junio de 2026, la compañía explicó que la orden impide que cualquier ciudadano extranjero utilice ambos modelos, ya sea dentro o fuera de Estados Unidos. La prohibición también incluye a empleados extranjeros de la propia Anthropic.

Según la empresa, aplicar esa restricción de manera selectiva no resulta viable, por lo que debe retirar Fable 5 y Mythos 5 para todos sus clientes. El acceso a los demás modelos de Anthropic no se verá afectado.

La compañía indicó que recibió la directiva gubernamental el 12 de junio a las 17:21, hora del Este de Estados Unidos. La carta, según Anthropic, no entregó detalles específicos sobre las aprehensiones de seguridad nacional que supuestamente justifican la medida.

Anthropic entiende que la decisión estaría relacionada con una técnica para eludir, o realizar un “jailbreak”, a las salvaguardas de Fable 5. La empresa revisó una demostración en la que el método permitía identificar un número reducido de vulnerabilidades menores que ya eran conocidas.

De acuerdo con Anthropic, las vulnerabilidades detectadas eran relativamente simples y también podían ser descubiertas mediante otros modelos disponibles públicamente, sin necesidad de evadir sus mecanismos de seguridad.

La empresa señala que, antes del lanzamiento de Fable 5, trabajó durante miles de horas con el Gobierno estadounidense, el Instituto de Seguridad de la IA del Reino Unido, organizaciones privadas y equipos internos para poner a prueba las salvaguardas del modelo.

Anthropic afirma que esos ejercicios mostraron que las protecciones de Fable 5 eran más eficaces que las de otros modelos desplegados previamente. Esta evaluación corresponde a la propia compañía y la publicación no aporta resultados completos que permitan verificarla de manera independiente.

Según la declaración, ningún evaluador ha encontrado hasta ahora un jailbreak universal capaz de desbloquear de forma amplia las capacidades cibernéticas restringidas del modelo. Anthropic reconoce, no obstante, que probablemente no sea posible conseguir una salvaguarda perfecta frente a estas técnicas con la tecnología actual.

La empresa distingue entre un jailbreak universal y uno limitado. El primero permitiría evadir ampliamente las salvaguardas de un modelo, mientras que el segundo solo conseguiría respuestas específicas bajo determinadas condiciones. Para gestionar ese riesgo, Anthropic aplicó en Fable 5 una estrategia de defensa en profundidad. Su objetivo declarado era conseguir que las evasiones fueran estrechas en alcance o muy costosas de desarrollar, combinando las salvaguardas con monitoreo para detectar y bloquear ataques.

La política también contempla conservar durante 30 días los datos de los clientes que utilizan Fable. Anthropic reconoce que esta medida tiene costos comerciales, pero sostiene que necesita esa información para investigar y mitigar técnicas de evasión.

La compañía afirma que no ha recibido información sobre un jailbreak limitado que haya producido resultados dañinos. Los casos comunicados hasta ahora, según su versión, habrían generado respuestas benignas o hallazgos menores sin mejoras específicas atribuibles a Mythos.

Anthropic sostiene que la evidencia entregada verbalmente por el Gobierno describe una técnica consistente, en términos generales, en pedir al modelo que revise una base de código y corrija fallas de software. La empresa dice haber revisado un informe que considera la base de la directiva. Su conclusión es que las capacidades demostradas allí están disponibles en otros modelos y son utilizadas habitualmente por equipos dedicados a la defensa de sistemas informáticos.

Anthropic menciona específicamente los despliegues de GPT-5.5 de OpenAI como ejemplo de modelos que, según su evaluación, pueden alcanzar capacidades similares. Esta comparación representa la interpretación técnica de Anthropic y no una conclusión presentada por el Gobierno estadounidense. Pese a sus objeciones, la empresa confirmó que cumplirá la directiva y eliminará el acceso a Fable 5 y Mythos 5. Al mismo tiempo, considera desproporcionado retirar un modelo comercial desplegado para cientos de millones de personas debido a un posible jailbreak limitado.

La compañía advierte que, si el mismo criterio se aplicara de forma uniforme, podría impedir el lanzamiento de nuevos modelos de frontera en toda la industria, dado que ningún proveedor puede garantizar actualmente una protección absoluta frente a técnicas específicas de evasión. Anthropic reconoce que los gobiernos deberían poder bloquear despliegues considerados inseguros. Sin embargo, sostiene que esa facultad debería ejercerse mediante un proceso definido por ley, transparente, justo y basado en evidencia técnica.

La empresa considera que la orden recibida no cumple esos principios. Atribuye la situación a un malentendido y afirma que trabaja para restablecer el acceso a Fable 5 y Mythos 5 lo antes posible, aunque no entrega una fecha estimada.

📬 Newsletter gratuito

Lo más relevante de tecnología y negocios digitales en español — cada día, en cinco minutos.

Últimos artículos