Microsoft estaría desarrollando su propio chip de IA para modelos lingüísticos de gran tamaño

18/04/2023

Según The Information, el semiconductor ha estado en desarrollo desde 2019, con un pequeño grupo de empleados de Microsoft y OpenAI probándolo actualmente. El Athena de nodo de proceso de 5 nm está diseñado para el entrenamiento de software como los modelos lingüísticos de gran tamaño (LLM), que han sido fundamentales en el reciente auge de la IA generativa. Sin embargo, el crecimiento de estos modelos se ha visto obstaculizado por la escasez de GPU en NVIDIA, líder del mercado de chips de entrenamiento de IA. The Information informó anteriormente de que esta escasez llevó a Microsoft a racionar las GPU de algunos equipos internos.

Los procesadores NVIDIA también se venden con un significativo margen de beneficio, lo que convierte a los chips internos en una alternativa potencialmente más barata para ejecutar las mismas cargas de trabajo. A pesar de ello, los chips de NVIDIA cuentan con una ventaja considerable en cuanto a software, ya que la mayoría de las cargas de trabajo de IA están diseñadas para ellos y la empresa cuenta con décadas de experiencia como desarrollador.

Es posible que Microsoft despliegue Athena para un uso más extenso dentro de la empresa y de OpenAI el año que viene. Sin embargo, actualmente está debatiendo si ofrecer también los chips a los clientes de Azure de forma más amplia. Google, su competidor en la nube, ha desarrollado su propia familia de chips de IA, los TPU, que en general se consideran el único chip rival actual para el desarrollo de LLM. Amazon también ha introducido su propia línea de productos alternativa, Trainium.

📬 Newsletter gratuito

Últimos artículos

IASoftware

Microsoft estaría desarrollando su propio chip de IA para modelos lingüísticos de gran tamaño

Últimos artículos

Gartner sitúa a la IA y los datos conectados en el centro de la evolución del ERP

IBM amplía su oferta de mainframes con modelos compactos para IA y nube híbrida

OpenAI presenta ChatGPT Work como agente para tareas empresariales prolongadas

Anthropic prueba Reflect para promover un uso más consciente de Claude

Borja Castelar abrirá el ERP Summit Chile 2026 con charla sobre IA y habilidades humanas

ERP Summit Chile 2026 abordará la aplicación de IA en gestión empresarial

GPT-5.6 llega a ChatGPT, Codex y la API con modelos Sol, Terra y Luna

WhatsApp corrige fallas que podían ocultar archivos ejecutables y procesar enlaces externos

Google abre AlphaEvolve para optimización de algoritmos en entornos empresariales