Una investigaci贸n reciente llevada a cabo por The Boston Consulting Group (BCG) ofrece una visi贸n matizada de las implicaciones para el rendimiento de confiar en herramientas de IA generativa como ChatGPT. En el exhaustivo estudio participaron m谩s de 750 consultores divididos en tres grupos distintos, cada uno con distintos niveles de acceso a las tecnolog铆as de IA, incluidas las versiones de ChatGPT potenciadas por GPT-3 y GPT-4.
Los investigadores establecieron una l铆nea base de rendimiento asignando 18 tareas similares a los participantes. Se les pidi贸 que completaran estas tareas con o sin la ayuda de herramientas de IA generativa. Los resultados fueron sorprendentes: Los asesores con IA completaron un 12,1% m谩s de tareas de media, las completaron un 25% m谩s r谩pido y ofrecieron resultados de una calidad significativamente superior.
Adem谩s, los beneficios de la IA se observaron en todo el espectro de habilidades. Los asesores por debajo de la media mejoraron sus resultados en un 43%, mientras que los asesores por encima de la media experimentaron un incremento del 17%. Sin embargo, el estudio tambi茅n suscit贸 preocupaci贸n por la dependencia excesiva de estas tecnolog铆as. Cuando se aplicaron a tareas “fuera de las limitaciones” de las capacidades establecidas de la IA, se produjo un descenso significativo del 19% en la resoluci贸n correcta de problemas entre los usuarios de la IA.
Los investigadores describieron un fen贸meno que denominaron “frontera tecnol贸gica irregular”. En esta frontera, la IA ofrece beneficios inconsistentes, a veces mejorando el rendimiento humano y a veces degrad谩ndolo. El estudio insta a los profesionales a estar atentos, ya que las capacidades de la IA, en r谩pida evoluci贸n y mal comprendidas, pueden conducir a un rendimiento sub贸ptimo si se aplican mal.
Las conclusiones del Boston Consulting Group se hacen eco de un estudio similar realizado por la Universidad de Purdue. En 茅l se descubri贸 que los ingenieros de software que utilizaban ChatGPT corr铆an el riesgo de aceptar respuestas inexactas, concretamente el 52% de las veces. Un sorprendente 77% de las respuestas tambi茅n se consideraron verborreicas. Los participantes a menudo cre铆an las respuestas incorrectas debido a su presentaci贸n exhaustiva y bien articulada.













