Concepto :

Estas fallas hicieron su aparición a principios del 2004. En febrero de ese año nos dimos cuenta que hacer redirecciones salvajes hacia otros sitios tenía por consecuencia el generar comportamientos extraños de Googlebot y de las páginas de resultados de Google. Todos los tipos de redirecciones están concernidos :

  • Redirection 301 : Moved Permanently
  • Redirection 302 : Moved Temporarily
  • Meta-Refresh à 0 segundos
  • Iframes, frames et javascript

Cada una de estas redirecciones, según la popularidad de la página emisora de la redirección, puede tener enormes consecuencias sobre el "objetivo" de la redirección.

La palabra Pagerank no significa nada hoy en día, o sí precisamente, ella tiene varias significaciones que hay que distinguir claramente :

  • el Pagerank que el navegador indica mediante el cálculo del checksum (IE o FF): éste corresponde a un viejo Pagerank que es actualizado de manera esporádica.
  • el Pagerank del directorio Google: DMOZ.
  • el Pagerank "real", aquel utilizado por Google de manera escondida en su algoritmo de clasificación.
Impacto sobre los Motores de Búsqueda: :

+   -
Para indexar un nuevo sitio, si tenemos el PR10, y que lo quitamos una vez obtenido, parece que estos nuevos sitios no están afectados por el efecto sandbox.   Permite hacer desaparecer un competidor con una popularidad menos elevada que la página que tiene la redirección. (Puede estar también considerado como una ventaja :p)
Tener una página web con un PR 10 para encontrar novia…:p   Algunos tipos de redirecciones permiten de intercambiar las posiciones con las de su competidor. Así un competidor mejor posicionado sobre ciertas palabras-claves sería "destruido" con una simple redirección.
No hemos querido probar lo siguiente, pero ¿qué pasaría si colocamos un robots.txt Disallow:/ en el directorio raíz de nuestro sitio PR 10 redirigido a Google.com y que después vamos a Google Remove para actualizar este robots.txt en 24H? ¿Google se "autodesposicionaría"?   En el marco de intercambio de enlaces, cualquiera puede entonces simular sitios web con un PR 5,6,7 o 8 para negociar con ventaja enlaces más interesantes… Si tenemos en cuenta la actitud de algunos webmasters que prefieren concentrarse sobre el PR en lugar del contenido, será importante en lo sucesivo de verificar el buen PR del sitio directamente en google.

Algunas técnicas que hemos imaginado todavía no han sido probadas, las únicas consecuencias inmediatas han sido las de suprimir las páginas del sitio www.pr10.darkseoteam.com previstas para obtener un PR4, PR3, PR2, PR2 et PR0. Estas páginas, al tener un Pagerank escaso, corrían el riesgo de desaparecer durante el test, razón por la cual las hemos suprimido.

En cuanto a la frecuencia de visitas del robot de Google, ésta corresponde al verdadero Pagerank de vuestro sitio. Una página PR10 no será más visitada ni mejor clasificada. Las páginas linkeadas no reciben ninguna transmisión del PR10, puesto que como lo veis en el script adjunto, simulamos el hecho de ser una otra página web, y en nuestro caso, hemos hecho creer a Google…que éramos Google (como ha remarcado Sam ; -)).

De acuerdo con nuestras observaciones, parece que la etiqueta meta-refresh perturba también a Yahoo! que pierde la cabeza con directivas de tipo:
site:site1.com que indica en la lista de resultados de las páginas del site1 la url de www.site2.com hacia la cual site1 ha hecho una redirección (queda claro? ;p).

En cuanto a la pregunta vista en el foro de ¿cómo podríamos aprovecharnos de este bug? la solución reside ciertamente en el hecho de poder salir gracias a este "truco" del sandbox y de poder indicar el PR deseado. Sin embargo, sus consecuencias son nefastas.
Así, numerosos webmasters se divierten con este tipo de consecuencias. En especial, debemos otorgar una cartulina roja a ciertas sociedades de afiliación que trabajan únicamente con este tipo de redirecciones, y que se aprovechan de ello para posicionar su enlace de redirección (con el pretexto de no controlar este fenómeno).
El peligro es grande para cada uno de nosotros, webmasters, empresas, sociedades de servicios, etc, estamos sometidos a la voluntad de Google que es quién decide a qué página debe asignar el contenido de las redirecciones.

Lo más peligroso en términos de "robo" de Pagerank y de posición es la etiqueta meta-refresh y los grupos iframes, frameset y javascript que permiten todo lo peor y que parecen irreversibles por el momento. Las redirecciones 301 y 302 son también peligrosas, pero con la retirada de las redirecciones, la situación vuelve a la normalidad después de un determinado plazo de tiempo.

Les hemos hecho esperar mucho, he aquí el código utilizado:

<?php
// Dark Seo Team Powered
Cloakin' Stuff // -> MakeYouWorkALittle (-;
if (GooglebotStealMyPage&Content)
{       // Code only for Google

	header("Status: 301 Moved Permanently");
	header("Location: http://www.google.com"); 
	exit();

}
else {
echo "I Steal His PR""; // visual page for all
// copy here all cool stuff u want
}
?>

Related links : http://www.pandia.com/sw-2004/40-hijack.html (us)

Credits : thanks to Seroundtable, Seo Chat, Philippe, Namepros, Seo Guy and all our spanish friends but too : fr, co.uk, .ru, .po, .ro, .jp, .dk .. to talk about our project and our team on your forum. We are very impressed of all about that.

Keep the line up !

++++++++++++++++++++++++++++++++++
Stuff Brainstormed By search engine hackers :
Vuln, Balmung, Noarchive, MrNice, Referer, Alexandra, Abendigo and Beslou.
Special greetz to Alexandra for the spanish traduction.