NVIDIA acelera el rendimiento de la inferencia de la IA con TensorRT 8

La octava generación del software TensorRT puede, por ejemplo, ejecutar BERT-Large, uno de los modelo de lenguaje más utilizados del mundo, en sólo 1,2 milisegundos.