La lingüística, que entre otras cosas describe patrones en los idiomas, puede ser utilizada para identificar usuarios determinados de Internet, por encima de los distintos servicios que utilizan.
Las dos lingüistas Aylin Caliskan Islam y Sadia Afroz revelaron en el Congreso de Chaos Communication realizado entre Navidad y Año Nuevo en Hamburgo, un procedimiento mediante el cual la lingüística puede revelar al 80% de los usuarios anónimos de Internet.
Para ello, ambas investigadoras utilizan un sistema lingüístico denominado estilometría.
Este método permite identificar la forma en que los usuarios se expresan, reconociendo palabras que se repiten constantemente y los conceptos usados por el usuario. Mediante un software especial es posible analizar y comparar patrones lingüísticos, que permiten determinar, por ejemplo, si es la misma persona formulando los mismos comentarios en distintos lugares de Internet.
“Si tenemos datos correspondientes a 100 usuarios, podemos identificar al menos a 80% de ellos”, declaró Sadia Afroz (a la derecha en la fotografía).
Traducciones deficientes
El mayor reto lo constituyen los idiomas distintos al inglés, que deberán ser traducidos para poder ser utilizados por el programa.
En este contexto, las expertas fueron categóricas al señalar que los servicios de traducción automática como por Google Translate y servicios similares reducen considerablemente la exactitud de servicio, y con ello su utilidad. Las investigadores consideran que los servicios dedicados y especializados de traducción podrán solucionar el problema.
Ineficaz con Leet
Otro de los un desafío aún mayor lo representa Leet (también conocido como Leetspeak), que Wikipedia define como “un tipo de escritura compuesta de caracteres alfanuméricos, usada por algunas comunidades y usuarios de diferentes medios de internet. Esta escritura es caracterizada por escribir caracteres alfanuméricos de una forma incomprensible para otros usuarios ajenos, inexpertos o neófitos a los diferentes grupos que utilizan esta escritura. El término “leet”, pronunciado lit, proviene de élite”.
Ambas investigadoras coinciden en que Leet es un sistema sencillamente impenetrable para la estilometría.
En el siguiente vídeo (1 hora y 39 minutos de duración, los investigadores presentan sus conclusiones.
Fuente: SC Magazine