viernes, diciembre 24, 2004

Secuestros de webs ¿bug de Google?

Viene de lejos el problema de las redirecciones, pero últimamente decenas de webs con cierta importancia han tenido que padecer estos "ataques".
En diversos foros anglosajones se ha reavivado esta vieja polémica, y se hacen llamamientos a Google para que corrija este "bug" que presuntamente contiene.

Resumiendo el tema:

Como funciona:
Google trata los meta-refresh como redireccionamientos 302. El efecto de esta redirección es que Googlebot indexa la página que contiene el 302 con el contenido de la página a la cual ha apuntado la redirección.

Consecuencias:
El filtro de contenido duplicado de Google en estos casos se encontrará dos páginas con el mismo contenido y la página "secuestrada" (hijacked) es sacada de las Serps. Si la página tiene PR, este pasará también a manos del "secuestrador".

Detección:
Modo 1:
Usando Linux podemos introducir:
lynx -mime_header URLsecuestrador

Incluyendo "http..." Lynx mostrará las cabeceras HTTP, de modo que podrás saber si es un meta-refresh, un 301(inocuo) o un 302.

Modo 2:
Busca tu dominio. Si encuentras un enlace en las SERPs que muestra el mismo título que tu web, podrías estar siendo "secuestrado".
Si clickas ese enlace y te lleva a tu web, es probable que tu web sufra este problema.
Si buscas los enlaces del atacante verás que son los tuyos.

¿Qué gana el atacante?:
Pensemos que aún y todo cuando alguien clicke en la web del secuestrador, el visitante será reenviado a tu web. Entonces, ¿Que gana?
Pues puede utilizar la técnica para dañar a un competidor al hacer caer la web original en las SERPS. También, y más probable, puede beneficiarse de los backlinks que la posición que te robó pueda reportarle y además puede cambiar cuando quiera el meta refresh (o el 302) y redirigirlo hacia una de sus propias webs.

Además si Google cae en la trampa e identifica la web del "atacante" como la original, se llevará consigo el PR de la web atacada.

Como evitarlo:
Ahora mismo no existe una cura infalible para este "ataque". Hay veces que el problema lo provocamos nosotros mismos al introducir nuestro enlace en directorios que usan este tipo de redirecciones.
Si el problema es grave se podría acudir al hosting del atacante aduciendo temas de copyrights (que te atiendan es otro problema).

Conclusiones:
El problema viene de lejos, y no siempre el "atacante" es consciente de que está dañando a la página que linkea. Muchos programas de enlaces (trackers) utilizan diferentes redireccionamientos que pueden eventualmente causar los problemas antes mencionados.

Por ahora Google no ha corregido el "bug", aún teniendo conocimiento del mismo desde hace meses, pero dada la difusión que se está dando al tema puede que pronto encuentre una solución.

- Más info

No hay comentarios: