Como señale en el artículo anterior, contenido duplicado y contenido copiado son dos cosas totalmente distintas, inclusive Google los considera de manera distinta.

Copiando lo que ya señale, si tu sitio web se dedica a copiar, de forma indiscriminada, el contenido de otra, sin agregar nada que lo haga especial, anda olvidándote de posicionar en forma orgánica dicho contenido, ademas te puedes acarrear un problema legal por posible violación del derecho de autor. Si copias contenido, por lo menos enlaza al sitio original y señala claramente quien es el autor de él mismo.

Por una parte Google puede sancionar tu contenido, también el mismo autor del contenido puede hacer valer ante la justicia sus derechos por haber encontrado que se vulneraban.

Cómo hacen la copia de contenidos.

Existes diferentes formas de copiar o “plagiar” un contenido en la web, algunas automatizadas y otras de forma manual o por intervención de manos humanas.

Según Google ( Directrices de calidad ), se esta frente a contenido copiado en los siguientes casos

  • Sitios que copian y vuelven a publicar contenido de otros sitios sin incluir contenido original ni valor añadido
  • Sitios que copian contenido de otros sitios, lo modifican ligeramente (por ejemplo, sustituyen sinónimos o usan técnicas automáticas) y lo vuelven a publicar
  • Sitios que reproducen feeds de contenido de otros sitios sin proporcionar ningún tipo de organización ni beneficio únicos al usuario
  • Sitios dedicados a insertar contenido como vídeo, imágenes u otro tipo de medios de comunicación de otros sitios sin valor añadido significativo para el usuario.

Para poder ser “archivados” tus contenidos, por lo general se utilizan unos robots, similares a los que utilizan los buscadores para indexar tu sitio web, pero estos lo leen y los publican en otro lugar, los feed son un buen alimento para dichos robots o scrapers

Cómo evitar la copia de contenidos.

Estas son algunas de las medidas que puedes considerar para evitar la copia de contenidos o lograr que Google sepa que tu contenido es el original.

Feeds

Como lo señale los feeds, muy utilizados en blogs y sitios similares para distribuir el contenido, son uno de los mejores alimentos para quienes tienen por costumbre copiar de forma automática, y con la ayuda de scrapers, todo el contenido de la web; por lo que es en ellos donde tendremos que invertir para evitar o minimizar los efectos de la copia.

1. Retrasar la publicación del Feed.

Para que Google logre indexar primero nuestro propio sitio web, y a su ves considerarlo como el contenido original, es recomendable aplazar la publicación del feed, esto es posible, en WordPress, si se incorpora el siguiente código, gracias a Natzir Turrado, a function.php de tu tema.

function retrasar_feed($where) {
  global $wpdb;
   if ( is_feed() ) {
    $now = gmdate('Y-m-d H:i:s');
    $wait = '10';
    $device = 'MINUTE';
    $where .= " AND TIMESTAMPDIFF($device, $wpdb->posts.post_date_gmt, '$now') > $wait ";
   }
  return $where;
}
add_filter('posts_where', 'retrasar_feed');

2. Enlace al original.

Enlazar hacia la dirección canonica de tu contenido es otra acción que puedes ejecutar para crear presente del origen de dicho contenido, esto lo puedes lograr gracias a plugins como WordPress SEO, para ésto, al tener instalado WordPress SEO dirigite a SEO -> Avanzado y selecciona la pestaña RSS.

Enlace al original en los Feeds RSS

3. No proporciones todo el contenido.

Otra de las medidas es proporcionar via feed de sindicación solo el extracto del artículo y no su contenido completo, para esto has de dirigirte a Ajustes -> Lectura.

Wordpress: Ajuste de Lectura

En ocasiones es necesario disponer en paralelo de una versión del feed completa, pero secreta, para esto el plugin SB RSS Feed+ es muy conveniente.

SB RSS Feed+

Web

Dentro del mismo sitio web puedes implementar algunos plugins que te pueden ayudar en algo a evitar el “respaldo” de tus contenidos por “personas caritativas, que solo quieren distribuir tus contenidos”.

Casi todos los plugins se basan en inhabilitar el uso del segundo botón del mouse y bloquear la posibilidad de copiar el texto del documento, algunos incluso bloquean el acceso a las herramientas como el inspector de elementos de Chrome o la visualización del Código Fuente de la página, ese es el caso de WP Content Copy Protection

Por otra parte, quizás no quieres bloquear la posibilidad de copiar el texto de tu sitio, pero si dejar en claro de donde salio, para esto puedes utilizar Tynt Insight for WordPress, un plugins que genera un enlace al final del texto que han copiado

Tynt

En el Servidor

Hay cosas que puedes hacer desde los archivos de configuración del servidor, especialmente el .htaccess.

1. Bloque por IP.

Si logras identificar la dirección ip de los scrapers pueden bloquear el acceso a traves del siguiente código, reemplaza la dirección ip por la del scrapers.

 	
 order allow,deny
 deny from 192.168.0.10
 allow from all

2. Bloqueo por Nombre de Dominio.

Muchas veces pueden los scrapers pueden tener diferentes IPs, pero vienen desde el mismo dominio.

RewriteEngine on
RewriteCond %{HTTP_REFERER} plagiadores.com [NC]
RewriteRule .* - [F]

3. Reemplaza tus imagenes.

Para dar una aviso, y dejar de manifiesta la copia del contenido puedes reemplazar las imágenes mostradas en tu artículo cuando no estén en alguno de los dominios que autorices.

RewriteEngine on
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://(www.)?midominio.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://(www.)?google.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://(www.)?lectordefeed1.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://(www.)?lectordefeed2.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://(www.)?dominioamigo.com/.*$ [NC]
RewriteRule .(gif|jpg|jpeg|png)$ http://midominio.com/img/aviso-copia.jpe [R,NC,L]

Redes Sociales

Para lograr que google indexe con antelación tu artículo, publicalo en tus propios perfiles sociales lo más pronto posible, especialmente en Twitter y Google+, si bien esto no nos asegura, es una ayuda más, especialmente es un enlace hacia el contenido original.

Google WebMaster Tools

En post de lograr que Google te indexe antes que los sitios que puedan haberte copiado tu contenido puedes, a traves de las Webmaster Tools, acelerar en parte dicho proceso, para esto accede a las Webmaster Tools y dirígete a Rastreo -> Explorar como Google, ingresa la dirección de tu artículo y presiona Obtener; luego de un momento, y cuando se despliegue los resultados clickea en enviar al Indice.

Como habrás visto, son pocas las herramientas que no permiten la copia de tus contenidos, incluso pueden llegar a ser contraproducentes, por lo que es más recomendable dejar en claro, ya sea al lector o al mismo Google quien es el autor real de los contenidos.