Mucho se habla sobre lo perjudicial del contenido duplicado para el posicionamiento web orgánico, que Google te puede llegar a penalizar si es que tienes contenido duplicado, sea tuyo o de otra web, cosa que no es del todo la valida.

Contenido Duplicado

Primero que nada, hay que tener claro qué es contenido duplicado, Google señala en su ayuda:

«El contenido duplicado generalmente hace referencia a bloques de contenido considerables en varios dominios que coinciden completamente o que son muy parecidos. La mayoría de las veces no se trata de un engaño» Ayuda de Herramientas para webmasters de Google

El mismo Google señala que la gran mayoría de las veces no se trata de un engaño, por lo que es ilógico pensar que están siendo «castigados» tus contenidos si es que son considerados como duplicados, lo que pueden estar siendo mostrados en los resultados de búsquedas los que precisamente tu no quieres que se muestren en forma prioritaria.

«Google intenta por todos los medios indexar y mostrar páginas con información diferente. Al utilizar este filtro, si tu sitio dispone de dos versiones de todos los artículos y ninguna de las dos está bloqueada mediante una metaetiqueta noindex, Google elegirá una de las dos versiones para mostrarla.»

Contenido Copiado

Por otra parte, el contenido copiado, aunque similar al contenido duplicado, tiene la gran diferencia en la forma e intencionalidad.

«Es posible que el contenido totalmente copiado, aunque provenga de fuentes de alta calidad, no proporcione valor añadido a los usuarios si no se proporcionan servicios útiles adicionales o contenido propio del sitio; también es posible que se produzca una infracción de derechos de autor en algunos casos.» Ayuda de Herramientas para webmasters de Google

Si tu sitio web se dedica a copiar, de forma indiscriminada, el contenido de otra, sin agregar nada que lo haga especial, anda olvidándote de posicionar en forma orgánica dicho contenido, ademas te puedes acarrear un problema legal por posible violación del derecho de autor. Si copias contenido, por lo menos enlaza al sitio original y señala claramente quien es el autor de él mismo.

Cómo hacen la copia de contenidos.

Existes diferentes formas de copiar o “plagiar” un contenido en la web, algunas automatizadas y otras de forma manual o por intervención de manos humanas.

Según Google ( Directrices de calidad ), se esta frente a contenido copiado en los siguientes casos

  • Sitios que copian y vuelven a publicar contenido de otros sitios sin incluir contenido original ni valor añadido
  • Sitios que copian contenido de otros sitios, lo modifican ligeramente (por ejemplo, sustituyen sinónimos o usan técnicas automáticas) y lo vuelven a publicar
  • Sitios que reproducen feeds de contenido de otros sitios sin proporcionar ningún tipo de organización ni beneficio únicos al usuario
  • Sitios dedicados a insertar contenido como vídeo, imágenes u otro tipo de medios de comunicación de otros sitios sin valor añadido significativo para el usuario.

Para poder ser “archivados” tus contenidos, por lo general se utilizan unos robots, similares a los que utilizan los buscadores para indexar tu sitio web, pero estos lo leen y los publican en otro lugar, los feed son un buen alimento para dichos robots o scrapers

Qué hacer frente al contenido duplicado del blog / sitio web

Google señala en sus recomendaciones que no se bloquee el acceso a los contenidos cuando están duplicados bloqueándolos con robots.txt u otros métodos.

Te puede ser de utilidad el utilizar alguno de los siguientes métodos:

Atributo rel=»canonical»

Una forma para dejar claro cual es el contenido original y cual es un duplicado es utilizar el atributo rel=»canonical»

Si bien WordPress lo implementa de fabrica, para una mejor utilización es recomendable echarle mano a algún plugin como el Yoast SEO, que lo implementa en todo el sitio y no solo en los artículos y páginas.

https://wordpress.org/plugins/wordpress-seo/

Dominio Preferido

Muchas veces un sitio web posee al menos dos direcciones, una con y otra sin www , http://midominio.com y http://www.midominio.com, ambas validas, para solucionar este problema es conveniente dirigirse a las Webmasters Tools de Google y señalarle cual de las dos direcciones es la preferida.

Redireccionamiento 301

En algunas ocasiones conviene la utilización del Redireccionamiento 301, hacia la dirección del contenido original, en el caso citado anterior, del sitio con y sin www, a parte de señalar cual es el dominio preferido es conveniente realizar un redireccionamiento 301 hacia el dominio preferido, esto también es aplicable cuando se utiliza http:// y https://

   RewriteCond %{HTTP_HOST} ^dominio.com [NC]
   RewriteRule ^(.*)$ http://www.nuevodomino.com/$1 [R=301,L]

También al darse el caso de tener el mismo contenido (identico) bajo dos direcciones es conveniente solo dejar una de ellas y realizar un redireccionamiento 301 hacia la dirección que no se elimina.

Redirect 301 /vieja-pagina http://www.dominio.com/nueva-pagina

Reducir el contenido similar

En algunas ocasiones puedes tratar una temática muy similar en dos páginas de tu sitio, para evitar que se de la situación de contenido duplicado es recomendable que unas las dos páginas en una solo o por el contraria que incrementes el contenido en cada una para hacerlas mucho más diferentes.

Cómo evitar la copia de contenidos.

Estas son algunas de las medidas que puedes considerar para evitar la copia de contenidos o lograr que Google sepa que tu contenido es el original.

Feeds

Como lo señale los feeds, muy utilizados en blogs y sitios similares para distribuir el contenido, son uno de los mejores alimentos para quienes tienen por costumbre copiar de forma automática, y con la ayuda de scrapers, todo el contenido de la web; por lo que es en ellos donde tendremos que invertir para evitar o minimizar los efectos de la copia.

1. Retrasar la publicación del Feed.

Para que Google logre indexar primero nuestro propio sitio web, y a su ves considerarlo como el contenido original, es recomendable aplazar la publicación del feed, esto es posible, en WordPress, si se incorpora el siguiente código, gracias a Natzir Turrado, a function.php de tu tema.

function retrasar_feed($where) {
  global $wpdb;
   if ( is_feed() ) {
    $now = gmdate('Y-m-d H:i:s');
    $wait = '10';
    $device = 'MINUTE';
    $where .= " AND TIMESTAMPDIFF($device, $wpdb->posts.post_date_gmt, '$now') > $wait ";
   }
  return $where;
}
add_filter('posts_where', 'retrasar_feed');

2. Enlace al original.

Enlazar hacia la dirección canonica de tu contenido es otra acción que puedes ejecutar para crear presente del origen de dicho contenido, esto lo puedes lograr gracias a plugins como WordPress SEO, para ésto, al tener instalado WordPress SEO dirigite a SEO -> Avanzado y selecciona la pestaña RSS.

Web

Dentro del mismo sitio web puedes implementar algunos plugins que te pueden ayudar en algo a evitar el “respaldo” de tus contenidos por “personas caritativas, que solo quieren distribuir tus contenidos”.

Casi todos los plugins se basan en inhabilitar el uso del segundo botón del mouse y bloquear la posibilidad de copiar el texto del documento, algunos incluso bloquean el acceso a las herramientas como el inspector de elementos de Chrome o la visualización del Código Fuente de la página, ese es el caso de WP Content Copy Protection

https://wordpress.org/plugins/wp-content-copy-protection/

Redes Sociales

Para lograr que google indexe con antelación tu artículo, publicalo en tus propios perfiles sociales lo más pronto posible, especialmente en Twitter y Google+, si bien esto no nos asegura, es una ayuda más, especialmente es un enlace hacia el contenido original.

Google WebMaster Tools

En post de lograr que Google te indexe antes que los sitios que puedan haberte copiado tu contenido puedes, a traves de las Webmaster Tools, acelerar en parte dicho proceso, para esto accede a las Webmaster Tools y dirígete a Rastreo -> Explorar como Google, ingresa la dirección de tu artículo y presiona Obtener; luego de un momento, y cuando se despliegue los resultados clickea en enviar al Indice.

Palabras al Cierre

Estas son solo algunas medidas que puedes implementar, sea para disminuir el contenido duplicado o prevenir la copia de tus contenidos por terceros.

Ten presente que algunas medidas pueden resultar engorrosas o incluso sobrecargar tu blog, por lo que es más recomendable dejar en claro, al lector y Google quien es el autor real de los contenidos.

Puedes encontrar otras más junto con como resguardar y crear un registro de tus contenidos amparados en el Derecho de Autor en un pequeño E-Book que he preparado para ti, Cómo evitar el contenido duplicado y/o copiado

Como siempre estoy atento a tus dudas a través de los Comentarios, del Formulario del blog y en mi Twitter. No dudes en compartir este articulo en tus redes sociales, te lo agradeceria un montón.