jueves, enero 13, 2005

Penalizaciones por contenido duplicado

Según parece, Google utiliza un curioso sistema de penalizaciones para las páginas que contienen contenido duplicado.
Las penalizaciones son acumulables y los castigos aumentan en esa proporción.

Así, si Google cree que tienes contenido duplicado (aunque sea por un 302) te aplicará esta tabla de penalizaciones:

Primera "infracción" : 30 días

Segunda infracción : 60 días

Tercera infracción : 90 días

Entonces, si por ejemplo cometes una infracción y google te pilla (aunque luego lo quites) si luego detecta otro contenido duplicado significará tu segunda infracción (60 días).

Parece ser que este tema lo confirmó el ingeniero de Google Matt Cutts en una conferencia de WMW en Las Vegas.

Vía Search Engine Roundtable

Actualización:

Según parece Matt Cutts recula y ahora dice que los 30-60-90 era un ejemplo nada más. Lo importante es que parece confirmarse lo de las penalizaciones temporales por contenido duplicado. Lo de menos es si son 30-60-90 o 24-51-106.

Actualización 2:

En la patente de google sobre "Detección de archivos duplicados" hay muchisima información sobre el tema de este post. Sobre las razones de las penalizaciones, los procedimientos y aspectos más técnicos.

vía Marcia

5 comentarios:

Anónimo dijo...

Me has ahorrado el post de esta noche ;). Te daré una referencia y vía, así acabo antes. Fran.

Anónimo dijo...

Hay algo que no entiendo referente a las páginas duplicadas.
¿Esto de duplicadas quiere decir que dos páginas tengan igual contenido?
Lo anterior es evidente que es algo duplicado pero me temo que google pueda entender por duplicado tener en un mismo dominio páginas sin contenido y claro está serían páginas duplicadas.
¿En ese caso google aplica una sanción?
Yo no lo veo muy justo ni sensato porque estaría sancionando multitud de webs que tienen páginas inútiles pero que no se han creado para "engañar" a google haciendole creer que hay más contenido del que realmente se dispone en esas webs.

El Telendro dijo...

El sistema para identificar contenidos duplicados seguramente sabrá discriminar sin problemas esas páginas sin contenido que comentas.
Ni tomará como contenido duplicado el que repitas una frase de otra fuente, ni seguramente aunque pongas un párrafo entero (si pones un enlace hacia la fuente aún más dificil).
Al sistema se le supone cierta inteligencia para diferenciar citas y referencias del plagio escandaloso.
Nada es perfecto, se le pasarán muchos plágios y se comerá algún que otro inocente.

Anónimo dijo...

Pensé que lo referente a páginas duplicadas no se mencionaba sólo por el supuesto de que existan páginas con idéntico texto (caso de los plagios)... está claro que google si que podrá detectarlo y de hecho así sucede.
¿Era sólo a esto a lo que se refería ese miembro de Google cuando hablaba de sanciones?
Yo apuntaba en otra dirección, en ocasiones nos podemos encontrar por ejemplo con dominios que pueden tener miles de páginas en las cuales sólo cambia el título y alguna palabra del cuerpo de cada página.
Esto por ejemplo lo he visto en muchos directorios, desde mediados de Diciembre de 2004 google comenzó a echar por tierra a directorios que podían tener este problema, supuse que esas penalizaciones se mencionaban por ese motivo.
A pesar de lo anterior, a mi parecer lo que hizo google a mediados del mes pasado no era una acción contra directorios sino contra dominios que tienen un número elevado de páginas que pudieran clasificarse como duplicadas al ser todas ellas páginas sin interés. En esta dirección apuntaba yo con esa mención a sanciones contra dominios con páginas duplicadas.

El Telendro dijo...

Ahora entiendo a que te referías. Las penalizaciones por duplicados se suelen aplicar a páginas espejo y a texto duplicado. Pero yo entiendo que lo que tu comentas también podría ser "penalizado". Aunque en este caso más que penalización sería no conceder valor a esas páginas clónicas. En este último caso no tachan de ladrón sino de poco útil para el visitante.

Para evitar esto último bastaría incluir algo de información diferenciada en cada página.

Más info sobre las penalizaciones en la segunda actualización del post.