NVIDIA y Microsoft presentan una pila unificada para agentes de IA en PC, nube y data centers

03/06/2026

En Microsoft Build, NVIDIA y Microsoft mostraron una estrategia conjunta para desarrollar, ejecutar y escalar agentes de IA en dispositivos Windows, Azure y despliegues locales, con hardware acelerado, modelos abiertos y entornos seguros.

En un artículo publicado por NVIDIA el 2 de junio de 2026, Dave Salvator describe los anuncios realizados en Microsoft Build, donde Jensen Huang, fundador y CEO de NVIDIA, participó en la keynote de Satya Nadella, presidente y CEO de Microsoft, mediante una transmisión desde Taipéi.

La propuesta conjunta se centra en dar a los desarrolladores una plataforma común para construir, ejecutar y escalar agentes de IA. Según NVIDIA, esto requiere no solo modelos, sino también hardware acelerado, entornos de ejecución seguros, una capa de datos capaz de responder con rapidez y modelos adecuados para razonamiento prolongado.

Uno de los anuncios destacados es RTX Spark, una nueva categoría de laptops y equipos compactos con Windows orientados a agentes personales. NVIDIA afirma que estos sistemas ofrecerán 1 petaflop de rendimiento de IA, hasta 128 GB de memoria unificada, batería para todo el día y rendimiento completo de IA y gráficos sin estar conectados a la corriente. La fuente presenta estas cifras como especificaciones del proveedor. Los equipos llegarían este otoño boreal de la mano de Microsoft Surface, ASUS, Dell, HP, Lenovo y MSI.

También se anunció DGX Station for Windows, descrito por NVIDIA como un supercomputador de escritorio para construir y ejecutar agentes sobre aplicaciones y flujos empresariales de Windows. El sistema estará basado en el NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip, con hasta 748 GB de memoria coherente y 20 petaflops de rendimiento FP4. NVIDIA sostiene que puede ejecutar modelos de frontera de hasta 1 billón de parámetros para agentes empresariales siempre activos. La disponibilidad se espera para el cuarto trimestre, con sistemas de ASUS, Dell, GIGABYTE, HP, MSI y Supermicro.

Ambos productos ejecutarán NVIDIA OpenShell, un entorno de ejecución seguro para agentes autónomos. Más adelante en el artículo, NVIDIA indica que OpenShell ya está integrado en GitHub Copilot y permite que cada agente se ejecute en un contenedor aislado, evaluando cada llamada saliente contra políticas antes de acceder a archivos, redes o credenciales. Las políticas se escriben como código, se versionan en el repositorio y pueden actualizarse dinámicamente. Según NVIDIA, OpenShell es de código abierto bajo licencia Apache 2.0, independiente del modelo y compatible con entornos locales, híbridos y de nube.

En Microsoft Foundry, NVIDIA anunció la disponibilidad de modelos abiertos para flujos agénticos, físicos y científicos. La compañía menciona Nemotron 3 Ultra, definido como un nuevo modelo abierto de razonamiento para agentes de larga duración en programación, investigación y flujos empresariales. También estarán disponibles Nemotron 3.5 ASR para reconocimiento de voz y Nemotron 3.5 Content Safety.

El artículo señala que las empresas podrán componer Nemotron con otros modelos de frontera y modelos locales, buscando equilibrar costo y calidad según cada flujo de trabajo. También menciona que modelos de Anthropic y OpenAI, junto con modelos de NVIDIA y agentes especializados Hermes, estarán disponibles en Foundry Agent Service con identidad y gobernanza integradas en Azure.

NVIDIA también destaca la integración de sus modelos y herramientas para IA física con Azure y la cadena de herramientas Physical AI de Microsoft. En este ámbito, menciona Cosmos 3, presentado como un «omnimodelo» abierto para IA física, con capacidades de razonamiento visual, simulación de mundos y generación de acciones. La fuente afirma que Cosmos 3 ocupa el primer lugar entre modelos abiertos en benchmarks clave de razonamiento visual, generación de mundos y generación de acciones, aunque el artículo no detalla la metodología de esas pruebas.

En la capa de datos, NVIDIA indica que su cómputo acelerado está incorporado en Microsoft Fabric Data Warehouse. Según pruebas internas de Microsoft citadas por NVIDIA, la ejecución SQL alcanza hasta seis veces más velocidad frente a una línea base basada en CPU y hasta siete veces más que tres proveedores líderes de data warehouse en la nube en cargas de alta concurrencia. Estas cifras deben leerse como resultados internos de Microsoft, ya que el artículo no presenta una validación independiente ni todos los detalles del benchmark.

Para despliegues locales e híbridos, Microsoft llevará Foundry Local sobre Azure Local a la plataforma NVIDIA RTX PRO 6000 Blackwell Server Edition. Combinado con la familia de modelos abiertos Nemotron, el objetivo es permitir cargas de IA de alto rendimiento cerca de donde residen los datos, incluyendo escenarios on-premises, híbridos o soberanos. NVIDIA añade que Foundry Local sobre Azure Local ya soporta despliegues multinodo y el runtime vLLM.

El artículo también menciona avances en infraestructura de centros de datos. NVIDIA señala que la «AI factory» Fairwater Wisconsin de Microsoft ya está activa antes de lo previsto, operando cientos de miles de sistemas NVIDIA Grace Blackwell como una fábrica de IA conectada con una instalación similar en Georgia. La fuente atribuye estos avances a trabajos conjuntos en energía, refrigeración, Ethernet NVIDIA Spectrum-X y el protocolo Multipath Reliable Connection.

Finalmente, NVIDIA indica que Microsoft ya validó la plataforma NVIDIA Vera Rubin para despliegue en centros de datos de Azure. Según la compañía, Vera Rubin puede entregar hasta diez veces más throughput de inferencia por megavatio y reducir el costo por token agéntico en un orden de magnitud. El artículo presenta estas cifras como afirmaciones de NVIDIA y no entrega una auditoría independiente en la nota.

📬 Newsletter gratuito

NVIDIA y Microsoft presentan una pila unificada para agentes de IA en PC, nube y data centers

Últimos artículos

La adopción empresarial de IA avanza, pero continúa fragmentada, según un estudio de SAP

La adopción de agentes de IA expone debilidades en los controles de identidad, según un estudio de IDC

Google estaría desarrollando Frozen v2, un chip especializado para la arquitectura de Gemini

El avance de Kimi reabre en Washington el debate sobre los modelos chinos de IA

Fusión en la industria de identidad digital: Veridas y Fourthline unen biometría y cumplimiento regulatorio

Anthropic pone fin al acceso incluido a Claude Fable 5 y lo compensa con créditos únicos de US$100

Ciberseguridad y pagos digitales: el desafío que Chile no puede postergar

Moonshot presenta Kimi K3, un modelo de 2,8 billones de parámetros orientado al trabajo autónomo

Gemini Omni llega a Google Vids para generar y modificar videos mediante instrucciones orales