Científicos desarrollan certero método para diferenciar textos humanos de los creados por IA

08/06/2023

Un equipo de académicos ha entrenado un algoritmo de aprendizaje automático para detectar artículos científicos generados por ChatGPT, afirmando que el software tiene una precisión de más del 99%.

La calidad de los modelos de IA generativa ha mejorado drásticamente en imitar la escritura humana en un corto período de tiempo, lo que dificulta que las personas distingan si el texto fue producido por una máquina o un humano. Esto ha llevado a preocupaciones de que los estudiantes que utilizan estas herramientas estén cometiendo plagio.

Sin embargo, el software diseñado para detectar texto generado por IA a menudo es poco fiable. Ante ello, un equipo de investigadores de la Universidad de Kansas decidió desarrollar una forma de detectar la escritura científica generada por IA, específicamente escrita en el estilo de artículos de investigación que suelen aceptar y publicar las revistas académicas.

El equipo de la Universidad de Kansas, liderado por Heather Desaire, profesora de química y autora principal de un artículo publicado en la revista Cell Reports Physical Science, compiló conjuntos de datos para entrenar y probar un algoritmo que clasificara artículos escritos por científicos y por ChatGPT. Seleccionaron 64 artículos de «perspectiva» -un estilo específico de artículo publicado en revistas científicas- que representan una amplia gama de temas desde biología hasta física, y solicitaron a ChatGPT que generara párrafos describiendo la misma investigación para crear 128 artículos falsos.

Posteriormente, el equipo compiló dos conjuntos de datos más, cada uno conteniendo 30 artículos de perspectiva reales y 60 artículos escritos por ChatGPT, totalizando 1,210 párrafos para probar el algoritmo. Los experimentos iniciales informaron que el clasificador era capaz de discernir entre la escritura científica real de los humanos y los artículos generados por IA el 100% de las veces. Sin embargo, la precisión a nivel de párrafo individual cayó ligeramente al 92%.

El equipo de investigadores cree que su clasificador es efectivo porque se centra en una serie de diferencias estilísticas entre la escritura humana y la de la IA. Los científicos son más propensos a tener un vocabulario más rico y a escribir párrafos más largos que contengan palabras más diversas que las máquinas. Además, utilizan signos de puntuación como interrogantes, paréntesis, puntos y comas con más frecuencia que ChatGPT, con la excepción de las comillas utilizadas para citas.

Deepfakes en la Darknet: Precio puede llegar hasta US$20,000 por minuto, advierte Kaspersky

Encuesta global sugiere que los consumidores sobrevaloran su capacidad para detectar las deepfakes

Navegando las deepfakes: Cómo reconocer las imágenes generadas por IA y protegerse contra la desinformación

Inteligencia artificial: herramienta clave para identificar y combatir las fake news

📬 Newsletter gratuito

Científicos desarrollan certero método para diferenciar textos humanos de los creados por IA

Últimos artículos

OpenAI lleva el control de agentes Codex a un macropad de US$230

ChatGPT vuelve a WhatsApp en Europa tras las medidas provisionales contra Meta

Silverfort presenta un caso de defensa frente a ataques autónomos de IA

Editoriales acusan a Google de entrenar Gemini con millones de obras sin autorización

Nueva beta de Spotify permite pedir música y consultar el historial mediante lenguaje natural

Globant y Egg ponen el foco en las personas para ampliar la adopción empresarial de IA en Argentina

Qualys e Integrity360 acuerdan distribuir servicios de gestión de riesgos en la península ibérica

En México, el futuro de la salud no está en más tecnología, sino en conectarla

El mayor ecosistema digital jamás construido y sus lecciones de ciberseguridad