Google busca fortalecer su posición en el terreno de la IA generativa con el lanzamiento de su nuevo modelo, Gemini, que desafía al GPT-4 de OpenAI. Gemini cuenta con sofisticadas capacidades de razonamiento multimodal, lo que sugiere un salto significativo en la carrera de la IA. Gemini de Google mejorará Bard, su principal chatbot, ofreciendo a los usuarios un razonamiento y un procesamiento del lenguaje elevados.
El modelo Gemini se presenta en tres niveles -Ultra, Pro y Nano- para adaptarse a diversas aplicaciones, desde el motor de Bard hasta mejoras para dispositivos móviles. Gemini Ultra, que debutará el año que viene, ha superado a GPT-4 en la mayoría de las pruebas de rendimiento.
Demis Hassabis, CEO de Google DeepMind, destacó las exhaustivas pruebas de Gemini y su rendimiento superior en una serie de tareas. Por ejemplo, Gemini Ultra superó a los expertos humanos con una puntuación, calificada como “prodigiosa”, de 90% en la prueba comparativa Massive Multitask Language Understanding (MMLU).
MMLU es un parámetro diseñado para evaluar la amplitud y profundidad de la comprensión de un modelo lingüístico. Introducido por Dan Hendrycks y otros expertos, MMLU es único porque evalúa modelos en una amplia gama de temas, desde humanidades, ciencias sociales y STEM, hasta campos especializados como derecho y ética. Este punto de referencia va más allá de las pruebas de conocimientos elementales, adentrándose en preguntas de nivel profesional que requieren amplios conocimientos del mundo y capacidad de resolución de problemas.
MMLU destaca por su carácter exigente, que refleja una mayor aproximación a cómo se evalúa a los seres humanos. Incluye al menos 100 ejemplos de texto para cada uno de sus 57 temas diversos. La complejidad de estas preguntas es tal que la precisión humana media es sólo del 34,5%, lo que pone de relieve la dificultad de nivel profesional de las tareas. La prueba está estructurada para evaluar tanto el análisis cualitativo, presente en asignaturas como filosofía e historia, como el cuantitativo, que incluye campos como las matemáticas y la informática.
La introducción de Gemini refleja el compromiso de Google con la IA generativa, que ofrece un soporte avanzado a los desarrolladores y una capacidad de resolución de problemas llena de matices. Su sofisticado razonamiento facilita la extracción de información relevante a partir de datos complejos, prometiendo revolucionar las aplicaciones de modelos lingüísticos de gran tamaño.
Este lanzamiento supone un reto estratégico para OpenAI y Microsoft. Refleja la capacidad de Google para innovar en el campo de la IA generativa, lo que puede redefinir las expectativas del sector y las experiencias de los usuarios.
Google presenta a Gemini en YouTube