Al anunciar la herramienta en AWS re:Invent 2020, Swami Sivasubramanian, VP de Amazon AI, dijo que Clarify proporcionará a los desarrolladores una mayor visibilidad de sus datos de entrenamiento, para mitigar posibles sesgos y explicar las predicciones.
Los sesgos son desequilibrios o disparidades en la exactitud de las predicciones entre diferentes grupos humanos, en función de la edad, género o el nivel de ingresos. Una amplia variedad de sesgos puede introducirse en un modelo debido a la naturaleza de los datos y a la realidad personal de los propios científicos de datos. Los sesgos también pueden surgir dependiendo de la forma en que los científicos interpretan los datos a través del modelo que construyen, lo que lleva, por ejemplo, a estereotipos raciales se extiendan a los algoritmos.
Por ejemplo, se ha comprobado que los sistemas de reconocimiento facial son bastante precisos para reconocer los rostros blancos, pero muestran mucha menos precisión al identificar a las personas de color.
Según AWS, SageMaker Clarify puede descubrir posibles sesgos durante la preparación de los datos, después de la formación y en un modelo desplegado analizando los atributos especificados por el usuario.
SageMaker Clarify funcionará dentro de SageMaker Studio – el entorno de desarrollo basado en la web de AWS para aprendizaje automático – para detectar prejuicios en el flujo de trabajo de tal aprendizaje, permitiendo a los desarrolladores construir imparcialidad en sus modelos. También ayudará a los desarrolladores a aumentar la transparencia explicando el comportamiento de un modelo de IA a los clientes y a las partes interesadas.
SageMaker Clarify también se integrará con otras capacidades de SageMaker como SageMaker Experiments, SageMaker Data Wrangler y SageMaker Model Monitor.
SageMaker Clarify está disponible en todas las regiones donde Amazon SageMaker está disponible. La herramienta será gratuita para todos los usuarios actuales de Amazon SageMaker.
Durante AWS re:Invent 2020, Sivasubramanian también anunció otras nuevas capacidades de SageMaker, incluyendo SageMaker Data Wrangler; SageMaker Feature Store, SageMaker Pipelines, SageMaker Debugger, Distributed Training on Amazon SageMaker, SageMaker Edge Manager, y SageMaker JumpStart.
El lanzamiento de SageMaker Clarify ha llegado en un momento en que se está produciendo un intenso debate sobre la ética de la IA y el papel de la parcialidad en los modelos de aprendizaje automático. El problema que plantean los prejuicios sistémicos en la IA ha sido persistente, y los gobiernos y las empresas apenas están empezando a abordarlo.
Ilustración: “Facial Recognition Art Mural, Hollywood CA #bornmodern” por YO! What Happened To Peace? con licencia CC BY-SA 2.0