Diario TI
IA

Anthropic presenta Claude Opus 4.8 con mejoras en razonamiento, agentes y programación

La actualización llega junto con nuevas funciones para Claude Code, claude.ai, Cowork y la API Messages, además de una reducción en el costo del modo rápido respecto de modelos anteriores.

Anthropic anunció el lanzamiento de Claude Opus 4.8, una nueva versión de su modelo Opus, disponible desde el 28 de mayo de 2026. Según la compañía, el modelo mejora sobre Opus 4.7 en distintos benchmarks y está orientado a ofrecer una colaboración más eficaz en tareas complejas.

El anuncio señala que Claude Opus 4.8 mantiene el mismo precio que Opus 4.7 para el uso regular: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida. Los desarrolladores pueden acceder al modelo mediante la API de Claude con el identificador claude-opus-4-8.

La empresa indica que Opus 4.8 presenta mejoras en pruebas de programación, habilidades agentivas, razonamiento y tareas prácticas de trabajo de conocimiento. Anthropic remite los detalles técnicos y una gama más amplia de evaluaciones a la tarjeta de sistema de Claude Opus 4.8.

Uno de los énfasis del anuncio está en el comportamiento del modelo durante tareas agentivas. Anthropic sostiene que evaluadores tempranos encontraron a Opus 4.8 más fiable y con mejor criterio al trabajar en tareas de varias etapas. La compañía también destaca mejoras en el uso de herramientas, seguimiento de instrucciones, manejo de contexto y capacidad para identificar incertidumbres o problemas en su propio trabajo.

En esa línea, Anthropic afirma que una de las mejoras más relevantes de Opus 4.8 es su «honestidad», entendida como una menor tendencia a presentar avances o conclusiones sin respaldo suficiente. De acuerdo con sus evaluaciones internas, el modelo sería aproximadamente cuatro veces menos propenso que su predecesor a dejar sin señalar fallas en código que él mismo escribió.

La compañía también informa que realizó una evaluación de alineamiento antes del lanzamiento. Según Anthropic, su equipo de Alignment concluyó que Opus 4.8 alcanzó nuevos máximos en medidas relacionadas con rasgos prosociales, como apoyar la autonomía del usuario y actuar en su mejor interés. La empresa añade que las tasas de conducta desalineada, como engaño o cooperación con usos indebidos, fueron sustancialmente menores que en Opus 4.7 y similares a las de Claude Mythos Preview.

El lanzamiento de Opus 4.8 llega acompañado de nuevas funciones. Una de ellas es «dynamic workflows», disponible en vista previa de investigación para Claude Code. Esta función permite que Claude planifique trabajos de gran escala y ejecute cientos de subagentes paralelos en una misma sesión, verificando después sus resultados antes de informar al usuario. Anthropic menciona como ejemplo migraciones de código a escala de repositorio, con cientos de miles de líneas, usando la suite de pruebas existente como criterio de validación.

Otra novedad es el control de esfuerzo en claude.ai y Cowork. Esta opción, ubicada junto al selector de modelo, permite al usuario elegir cuánto esfuerzo debe dedicar Claude a una respuesta. En configuraciones más altas, el modelo piensa con mayor frecuencia y profundidad; en niveles más bajos, responde más rápido y consume los límites de uso con menor intensidad. Anthropic indica que esta función está disponible en todos los planes.

Para desarrolladores, la API Messages incorpora ahora la posibilidad de aceptar entradas de sistema dentro del arreglo de mensajes. Según Anthropic, esto permite actualizar instrucciones de Claude durante una tarea sin romper la caché del prompt ni canalizar el cambio mediante un turno de usuario. La compañía plantea usos como modificar permisos, presupuestos de tokens o contexto de entorno mientras un agente está en ejecución.

Anthropic también introdujo cambios relacionados con los niveles de esfuerzo. Opus 4.8 usa por defecto el nivel alto, que la empresa considera el mejor equilibrio entre calidad y experiencia de usuario. En tareas de programación, ese nivel consumiría una cantidad de tokens similar al valor predeterminado de Opus 4.7, pero con mejor desempeño, según la compañía. Los usuarios pueden escoger niveles superiores, como «extra» o «max», para tareas difíciles o flujos de trabajo asincrónicos de larga duración.

En cuanto al modo rápido, Anthropic señala que Opus 4.8 puede trabajar a 2,5 veces la velocidad y que esta modalidad es ahora tres veces más barata que en modelos anteriores. Para este modo, el precio anunciado es de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida.

La empresa describe la actualización como una mejora «modesta pero tangible» respecto de Opus 4.7. También anticipa que trabaja en modelos capaces de ofrecer capacidades similares a Opus a menor costo, y en una nueva clase de modelos con mayor inteligencia que Opus. Según el anuncio, un número reducido de organizaciones ya utiliza Claude Mythos Preview en trabajos de ciberseguridad dentro del Proyecto Glasswing, aunque Anthropic afirma que modelos de ese nivel requieren salvaguardas cibernéticas más sólidas antes de un lanzamiento general.

Fuente: Anthropic, «Introducing Claude Opus 4.8», publicado el 28 de mayo de 2026 https://www.anthropic.com/news/claude-opus-4-8

📬 Newsletter gratuito

Lo más relevante de tecnología y negocios digitales en español — cada día, en cinco minutos.

Últimos artículos