El spam a buscadores se ha convertido en un verdadero problema para Google y el resto de motores de búsqueda. Webmasters sin escrúpulos han creado miles de páginas con el único propósito de enlazar con sus páginas principales y con esto hacer subir su PageRank (en el caso de Google) o cualquier otro algoritmo utilizado por buscadores que tienen en cuenta el número de enlaces que recomiendan una página, a la hora de determinar la importancia de ésta y situarla en mejor posición en los resultados de búsqueda.
Esta es la técnica utilizada para conseguir que cuando buscas Ladrones en Google, te aparezca en primera posición la web de la SGAE.
El nuevo algoritmo de Google evitaría este tipo de prácticas.
La finalidad del PageRank es asignar un valor numérico a las páginas web según el número de veces que otras páginas las recomienden y según el PageRank que éstas tengan a su vez. Es decir, establece la importancia de esa página web. Su lógica es la siguiente: si una página web enlaza con otra página, es que la está recomendando. Y si la recomienda, es que debe ser importante en el ámbito del tema que trata la primera página web. Una recomendación que proviene de una página que a su vez está muy recomendada vale más que una recomendación que provenga de una página que casi nadie recomienda.
Google desea que en las primeras posiciones de los resultados de búsqueda encontremos páginas de cierta relevancia y que estén siendo recomendadas por otras páginas que a su vez también tengan relevancia. Para determinar el PageRank, Google analiza el número de enlaces que provienen de otras páginas web y su PageRank. El Trust Rank, parte de la misma base. Pero en lugar de valorar la importancia de una recomendación en función del PageRank de la página que recomienda, lo hace a partir de una serie de páginas web que han sido consideradas importantes por humanos en lugar de por algoritmos.
A las páginas web que los humanos han determinado como importantes se las considera web semilla y a sus enlaces se les asigna un valor. Y será ese valor el que se irá transmitiendo por toda la red.
Para ilustrarlo con un ejemplo: Supongamos que disponemos de una web semilla A. A trasmitirá un valor de 100 Trust Rank a todas las webs a las que enlace. Estas páginas, a su vez, transmitirán un Trust Rank de 99 a todas las webs a las que enlacen. Y éstas últimas, transmitirán un Trust Rank de 98 a las que ellas enlacen.
Para mitigar la degradación del Trust Rank a medida que se distancia de las webs semilla, en el algoritmo se ha incluido un corrector que tiene en cuenta el número de grados que hay entre la web semilla y la web que recibe el Trust Rank, sin anular completamente la distancia que las separa de la semilla.
Según un documento de la Universidad de Standford que versa sobre el Trust Rank, de la misma manera que las webs semilla van a transmitir Trust Rank, las webs consideradas spam por los humanos que evalúan las webs, van a transmitir Trust Rank negativo. Según este documento ciertas webs van a restar Trust Rank y cuando una página web sitúe su nivel de Trust Rank por debajo de una determinada cifra, va a convertirse automáticamente en una web que transmite Trust Rank negativo en lugar de positivo.
En www.alt64.com se explican más detalles acerca del Trust Rank. Y para quién desee ampliar conocimientos, puede consultar el enlace al documento de la Universidad de Stanford que versa sobre el Trust Rank.