Diario TI

OpenAI entra al diseño de aceleradores con Jalapeño, su primer «Intelligence Processor»

La compañía afirma que Jalapeño forma parte de una estrategia de infraestructura full-stack y que será la primera pieza de una plataforma multigeneracional de cómputo para IA.

OpenAI y Broadcom presentaron Jalapeño, el primer chip de inferencia diseñado por OpenAI para modelos de lenguaje de gran escala. Según el anuncio publicado por OpenAI el 24 de junio de 2026, el acelerador forma parte de una plataforma de cómputo multigeneracional que ambas compañías están desarrollando junto a socios de infraestructura.

OpenAI describe a Jalapeño como su primer «Intelligence Processor», una categoría propia para un acelerador construido en torno a las necesidades de inferencia de LLM. La empresa afirma que el diseño busca mejorar velocidad, confiabilidad y costo de operación para productos como ChatGPT, Codex, la API y futuros sistemas de agentes.

El chip fue entregado a Sam Altman, CEO de OpenAI, y Greg Brockman, presidente de la compañía, por Hock Tan, presidente y CEO de Broadcom, y Charlie Kawwas, presidente de Broadcom. OpenAI presenta ese hito como parte de su estrategia para construir más componentes de la pila tecnológica que sostiene sus modelos y productos.

Según se indica, OpenAI diseñó el chip desde cero a partir de su experiencia con modelos, kernels, sistemas de serving y necesidades de producto. Broadcom aporta implementación de silicio, tecnologías de red y conectividad, incluidas soluciones asociadas a Tomahawk. Celestica participa en placas, integración de racks, sistemas y producción escalable.

OpenAI señala que las muestras de ingeniería de Jalapeño ya ejecutan cargas de trabajo de aprendizaje automático en laboratorio, a frecuencia y potencia objetivo de producción. Entre esas cargas menciona GPT-5.3-Codex-Spark. La empresa indica, sin embargo, que aún está midiendo el rendimiento final y que publicará un informe técnico detallado en los próximos meses.

La afirmación principal de rendimiento es todavía preliminar. OpenAI sostiene que las primeras pruebas muestran una relación rendimiento por vatio sustancialmente mejor que el máximo registrado actualmente, pero no entrega cifras comparativas ni metodología en el anuncio. La compañía atribuye esa mejora a una arquitectura que reduce el movimiento de datos y equilibra cómputo, memoria y recursos de red para acercar la utilización real al rendimiento teórico del hardware.

Jalapeño está diseñado específicamente para inferencia moderna de LLM, no como un acelerador de propósito general adaptado desde cargas anteriores de IA. OpenAI afirma que su objetivo es combinar potencia y desempeño de aceleradores líderes con una latencia cercana a la de sistemas especializados de inferencia, un punto relevante para productos interactivos a gran escala.

Greg Brockman, presidente y cofundador de OpenAI, enmarca Jalapeño dentro de una estrategia de infraestructura full-stack. Según Brockman, diseñar más componentes de la pila permitiría servir más «inteligencia» con mayor eficiencia y avanzar hacia un acceso más amplio a IA avanzada.

Richard Ho, responsable del programa de hardware de OpenAI, sostiene que la arquitectura fue optimizada alrededor de kernels, movimiento de memoria, redes y patrones de serving relevantes para modelos de frontera. De acuerdo con Ho, las pruebas iniciales sugieren que Jalapeño puede ejecutar cargas importantes cerca de los límites teóricos del hardware.

El desarrollo también destaca por su calendario. OpenAI afirma que Jalapeño pasó de diseño inicial a tape-out de fabricación en nueve meses, un ciclo que la compañía considera uno de los más rápidos logrados para un ASIC avanzado de alto rendimiento. La empresa atribuye esa velocidad a la colaboración software-hardware con sus equipos de ingeniería, a la experiencia de Broadcom y al uso de modelos de OpenAI para acelerar partes del diseño y optimización.

La plataforma está pensada para despliegue inicial hacia fines de 2026 y para expansión en los años siguientes. Hock Tan, de Broadcom, afirmó que la colaboración busca habilitar centros de datos a escala de gigavatios con Microsoft y otros socios a partir de 2026.

OpenAI indica que el foco de Jalapeño está en la inferencia, el punto en que los modelos llegan al usuario final. En esa lógica, mejoras de costo, velocidad y confiabilidad podrían reflejarse en respuestas más rápidas de ChatGPT, tareas de Codex con menos espera, productos API más económicos de construir o mayor disponibilidad cuando la demanda es alta.

La empresa no presenta a Jalapeño como un producto disponible para terceros ni detalla especificaciones técnicas completas, benchmarks verificables, proceso de fabricación, volumen de producción o modelo comercial. Por ahora, el anuncio posiciona al chip como el inicio de una plataforma propia de infraestructura para inferencia de IA.

📬 Newsletter gratuito

Últimos artículos