Los sistemas de inteligencia artificial ya están acelerando el desarrollo de nuevos modelos, aunque todavía no pueden dirigir de manera autónoma todo el proceso de investigación. Esa es la conclusión central de un análisis publicado por Anthropic Institute bajo el título “When AI builds itself”.
El documento, elaborado por Marina Favaro y Jack Clark, “When AI builds itself» combina benchmarks públicos con datos internos de Anthropic para evaluar cuánto trabajo de ingeniería e investigación está siendo delegado a Claude.
La empresa define la auto-mejora recursiva como un escenario en el que un sistema de IA puede diseñar y desarrollar de manera autónoma a su propio sucesor. Anthropic aclara que esa capacidad aún no existe y que su aparición no es inevitable, pero sostiene que podría llegar antes de que las instituciones estén preparadas.
Según la compañía, la evolución ha pasado desde chatbots que sugerían fragmentos de código hasta agentes que editan archivos, ejecutan programas y delegan varias horas de trabajo a otros agentes. El cierre completo del ciclo ocurriría si esos sistemas también pudieran construir y entrenar los modelos que los reemplazarán.
Anthropic cita mediciones de METR según las cuales la duración de las tareas que los modelos pueden completar de manera confiable se duplica aproximadamente cada cuatro meses. Claude Opus 3 resolvía en marzo de 2024 tareas equivalentes a unos cuatro minutos de trabajo humano; Claude Sonnet 3.7 alcanzó alrededor de una hora y media un año después, y Claude Opus 4.6 llegó a tareas de 12 horas en 2026.
Estas tendencias son extrapolaciones y no garantizan que el ritmo se mantenga. La propia Anthropic reconoce que las curvas podrían desacelerarse por límites de arquitectura, energía, capacidad computacional, fabricación de chips o calidad del juicio de los modelos.
Los datos internos muestran, sin embargo, una automatización significativa. En mayo de 2026, Claude era autor de más del 80% de las líneas de código incorporadas al entorno de producción de Anthropic. Antes de la vista previa de Claude Code, en febrero de 2025, esa proporción estaba en un solo dígito.
Durante el segundo trimestre de 2026, el ingeniero típico incorporó ocho veces más código por día que en 2024. Anthropic advierte que las líneas de código miden cantidad y no calidad, por lo que esa cifra probablemente exagera el aumento real de productividad.
Una encuesta interna realizada en marzo entre 130 integrantes de los equipos de investigación arrojó que el encuestado mediano estimaba producir cuatro veces más con Mythos Preview. La empresa reconoce que esa percepción podría sobrestimar el efecto real.
En abril, Claude implementó más de 800 correcciones que redujeron mil veces una clase de errores de API. El ingeniero responsable estimó que una persona habría tardado cuatro años en realizar ese trabajo. Esta comparación corresponde a una estimación interna y no a una medición independiente.
Anthropic también informa mejoras en tareas abiertas. En mayo de 2026, Claude alcanzó una tasa de éxito de 76% en la categoría más compleja evaluada internamente, 50 puntos porcentuales más que seis meses antes. La evaluación fue realizada por otro modelo Claude, una metodología que puede introducir limitaciones.
La compañía considera que el código generado por Claude ya se aproxima en calidad al producido por sus ingenieros. También emplea un revisor automatizado para buscar errores y vulnerabilidades antes de fusionar cambios. Un análisis retrospectivo sugiere que ese sistema habría detectado cerca de un tercio de los errores relacionados con incidentes anteriores en Claude.ai.
En investigación, los modelos muestran su mayor capacidad cuando reciben un objetivo y criterios claros. En una prueba para optimizar código de entrenamiento, Claude Opus 4 consiguió en mayo de 2025 una aceleración aproximada de tres veces. Mythos Preview alcanzó cerca de 52 veces en abril de 2026.
Anthropic advierte que este resultado depende del margen de mejora del código inicial y no debe interpretarse como una aceleración general del entrenamiento de modelos. La comparación relevante, sostiene, es la evolución observada bajo las mismas condiciones experimentales.
La empresa también describe un proyecto abierto de seguridad de IA ejecutado por agentes de Claude. Dos investigadores humanos recuperaron aproximadamente 23% de la brecha de rendimiento estudiada durante una semana, mientras los agentes alcanzaron 97% tras 800 horas acumuladas y unos US$18.000 de cómputo.
El resultado no se trasladó limpiamente a modelos de escala productiva. Además, las personas eligieron el problema y diseñaron el sistema de evaluación. Dentro de esos límites, los agentes propusieron y ejecutaron los experimentos sin dirección humana significativa.
La principal brecha sigue estando en el juicio. Claude puede ejecutar experimentos bien especificados, pero las personas conservan ventaja para determinar qué problemas importan, qué resultados son confiables y cuándo abandonar una línea de investigación.
Anthropic evaluó 129 momentos en que investigadores humanos habían seguido caminos poco productivos. Mythos Preview propuso una alternativa juzgada superior en 64% de esos casos. Sin embargo, la selección estaba deliberadamente compuesta por decisiones humanas mejorables y no constituye una comparación general entre el criterio humano y el del modelo.
El análisis plantea tres escenarios. El primero es que el avance se desacelere, aunque las capacidades actuales se difundan ampliamente. El segundo, considerado más probable por Anthropic, es que continúen las ganancias acumulativas de eficiencia, con humanos fijando objetivos mientras los agentes ejecutan la mayor parte del trabajo.
El tercer escenario es la auto-mejora recursiva completa: sistemas capaces de diseñar y perfeccionar a sus sucesores. En ese contexto, el avance dependería principalmente del cómputo y de mejoras algorítmicas, mientras las personas se concentrarían en supervisión, validación y verificación.
Anthropic advierte que ese escenario podría acelerar la ciencia, la medicina y la ingeniería, pero también aumentar el riesgo de pérdida de control. Pequeños problemas de alineación podrían propagarse a medida que los modelos construyan nuevas generaciones menos comprendidas por sus supervisores.
La empresa considera deseable que exista la posibilidad de ralentizar o pausar temporalmente el desarrollo de IA de frontera. Sin embargo, señala que una pausa unilateral podría beneficiar a los actores menos cautelosos. Una medida efectiva requeriría coordinación internacional y mecanismos para verificar que laboratorios de distintos países cumplen las mismas condiciones.
El Anthropic Institute anunció que organizará conversaciones con autoridades, investigadores, organizaciones civiles y otras empresas de IA. El propósito será estudiar la auto-mejora recursiva y desarrollar opciones de coordinación antes de que las capacidades descritas cierren completamente el ciclo de desarrollo.
📬 Newsletter gratuito
Lo más relevante de tecnología y negocios digitales en español — cada día, en cinco minutos.






