Según The Information, el semiconductor ha estado en desarrollo desde 2019, con un pequeño grupo de empleados de Microsoft y OpenAI probándolo actualmente. El Athena de nodo de proceso de 5 nm está diseñado para el entrenamiento de software como los modelos lingüísticos de gran tamaño (LLM), que han sido fundamentales en el reciente auge de la IA generativa. Sin embargo, el crecimiento de estos modelos se ha visto obstaculizado por la escasez de GPU en NVIDIA, líder del mercado de chips de entrenamiento de IA. The Information informó anteriormente de que esta escasez llevó a Microsoft a racionar las GPU de algunos equipos internos.
Los procesadores NVIDIA también se venden con un significativo margen de beneficio, lo que convierte a los chips internos en una alternativa potencialmente más barata para ejecutar las mismas cargas de trabajo. A pesar de ello, los chips de NVIDIA cuentan con una ventaja considerable en cuanto a software, ya que la mayoría de las cargas de trabajo de IA están diseñadas para ellos y la empresa cuenta con décadas de experiencia como desarrollador.
Es posible que Microsoft despliegue Athena para un uso más extenso dentro de la empresa y de OpenAI el año que viene. Sin embargo, actualmente está debatiendo si ofrecer también los chips a los clientes de Azure de forma más amplia. Google, su competidor en la nube, ha desarrollado su propia familia de chips de IA, los TPU, que en general se consideran el único chip rival actual para el desarrollo de LLM. Amazon también ha introducido su propia línea de productos alternativa, Trainium.