Gran parte del contenido original publicado en internet, de una forma u otra, ya sea total o parcial, está publicado en otras páginas webCualquier propietario de una página web, blog o portal de noticias que produzca contenidos corre el riesgo de que alguien le robe el contenido. Pasa más a menudo de lo que piensas: los ladrones copian los contenidos para publicarlos tal cual, o bien los reescriben para que parezcan nuevos.

De hecho, a veces es el mismo autor el que lo provoca publicándolo en directorios para asegurarse una mayor propagación de la información. En otros casos el contenido es copiado en páginas web que vinculan a la fuente original debido a su relevancia o se plagia intencionalmente, tratando de asegurarse la autoría. Este punto es muy serio, ya que puede pasar que la copia supere al original en los resultados de búsqueda, de modo que el ladrón no sólo se adjudica el mérito por tu trabajo, sino que encima se lleva el tráfico que genera.

Uno de los motivos más comunes es que el contenido copiado se ha indexado antes que el original. Otras veces, el buscador asume que la fuente original es el sitio de mayor autoridad. ¿Cómo te proteges? No puedes cambiar el funcionamiento de Google, pero sí prevenir sus errores. Este post, originalmente publicado por Deteresa, un crack al que os recomiendo seguir, explica cómo obtener el crédito por tus contenidos, además de enseñarte a detectar el robo, bloquearlo y gestionarlo.

También te puede interesar:

Trucos para prevenir la copia del contenido

#1 Renombrar el sitemap

Una forma de extraer el contenido de tu sitio consiste en usar el sitemap o mapa del sitio como punto de partida y seguir los enlaces. Dado que el propósito del sitemap es señalar todas las páginas indexables de la página web, es uno de los métodos más sencillos de acceder al contenido que realmente importa. Afortunadamente hay una forma de evitar que alguien encuentre tu sitemap, y es tan sencilla como cambiarle el nombre. Porque quizá no lo sepas, pero no necesitas que el mapa del sitio se llame “sitemap”, sino que puedes darle el nombre que quieras.

Una vez lo hayas renombrado a tu gusto, evita reflejarlo en el archivo robots.txt, ya que cualquiera podría verlo. En su lugar puedes dejar un sitemap «de pega» y subir el bueno al buscador con las Herramientas para webmasters.

También te puede interesar:

#2 Añadir un enlace a la fuente

Lo que es una buena idea, además de una práctica SEO recomendable, es salpicar tus contenidos con enlaces internos. Así, aunque no puedas evitar que copien tu contenido, al menos podrás conseguir algo de tráfico para tu página web. No obstante, hay algo más importante que poner enlaces a páginas internas, y es incluir un enlace a la página original. El motivo es sencillo: Google considera esta señal como un indicador fiable de la fuente del contenido. Puedes añadir el enlace de dos maneras:

  • En el feed RSS: Dado que los scrapers suelen robar contenido de ahí, puedes obtener el crédito añadiendo un enlace al final del artículo en el feed. Yoast incluye esta función en su plugin WordPress SEO, pero si usas otro plugin de SEO o Génesis no hay problema, también tienes el plugin RSS footer.
  • Al copiar y pegarTynt auto-inserta un enlace cuando alguien copia y pega texto desde tu sitio, lo que puede animar al usuario a citar la fuente. Además, ofrece estadísticas interesantes sobre el número de copias realizadas, los enlaces ganados y el tráfico generado.

Otra ventaja de incluir un enlace de vuelta es que si el scraper tiene activado el aviso a sitios enlazados, recibirás un trackback cada vez que el contenido se publique. Sólo tienes que adquirir la costumbre de revisar los trackbacks de vez en cuando.

También te puede interesar:

#3 Retrasar la publicación del feed

Aunque el feed RSS es un medio perfecto para distribuir los contenidos, es también la fuente de la que beben los scrapers. Sólo por si no lo sabes, scraper es un software robot que extrae la información de tu feed para publicarla en otras páginas web. Normalmente no tendrás problemas si tu página se indexa en primer lugar. Pero si por alguna razón la copia del scraper llega antes a los índices de búsqueda, tus posibilidades de rankear van a ser escasas por tratarse de contenido duplicado.

Un método para evitar esto consiste en retrasar la publicación del feed. Por ejemplo, 10 minutos de retardo. De esta forma das tiempo al buscador para indexar tus contenidos antes que cualquier pueda consumirlos por RSS. Implementar el retraso en el feed es sencillo. Si usas WordPress sólo tienes que pegar el siguiente código en el archivo functions.php. La cantidad de tiempo viene determinada por la variable &wait:

function retrasar_feed($where) {
global $wpdb;
if ( is_feed() ) {
$now = gmdate(‘Y-m-d H:i:s’);
$wait = ’10′;
$device = ‘MINUTE';
$where .= ” AND TIMESTAMPDIFF($device, $wpdb->posts.post_date_gmt, ‘$now’) > $wait “;
}
return $where;
}
add_filter(‘posts_where’, ‘retrasar_feed’);

Si prefieres no tocar código de tu página web o blog y usas Wordpress, puedes usar un plugin como RSS Manager.

#4 Enviar la página a través de las Herramientas para Webmasters

Si tu página web es nueva, Google suele tardar bastante en encontrarte e indexar tus nuevas páginas. Te voy a explicar un método para acelerar el proceso. Nada más publicar, haz lo siguiente:

  1. Accede a las Herramientas para webmasters de Google
  2. Dirígete al menú Rastreo > Explorar como Google
  3. Introduce la URI del post y recupérala
  4. Para terminar, envía al índice la página

Normalmente llevará menos de un día que Google indexe el contenido, lo cual es poco si tienes en cuenta lo que tarda el buscador en indexar las páginas de sitios nuevos.

También te puede interesar:

#5 Crear alertas en Google Alerts

Una vez has publicado tu entrada, puedes detectar copias robadas de tu contenido mediante las Alertas de Google. Cada vez que el buscador encuentre una copia, te enviará un email. Para ello, configura el servicio de la siguiente manera:

  • Consulta: Introduce el título del post entre comillas (Si quieres estar más seguro, puedes crear algunas variantes para fragmentos del post, también entre comillas)
  • Tipo de resultado: Te interesa cubrirlos todos
  • Frecuencia: Cuando se produzca, para poder actuar cuanto antes
  • Cantidad: Todos los resultados

Por desgracia, el servicio de alertas de Google está limitado a los 20 primeros resultados para la web y a los 10 primeros para las noticias.

#6 Usar herramientas para detectar plagios

Otra forma de detectar copias de tu contenido es mediante Plagium, GrammarlyCopyscape u otros servicios similares. La versión gratuita de Copyscape permite introducir una URL de tu sitio para buscar duplicados a lo largo y ancho de la Web. El problema es que cuando tienes una página web con cientos o miles de páginas esta función se queda corta. Afortunadamente hay una versión capaz de analizar el sitio enteroCopyScape Premium permite:

  • Comprobar todo el sitio: La búsqueda por lotes o batch search busca copias de hasta 10.000 páginas de tu sitio en una única operación
  • Comparar el contenido: Cuando se da un positivo, tienes la posibilidad de ver la comparación palabra por palabra, resaltando las coincidencias en color
  • Gestionar casos de plagio: También puedes hacer el seguimiento de cada uno de los casos de plagio encontrados
  • Excluir ciertas páginas: Tanto si publicas el mismo contenido en varias páginas de tu propiedad como si tienes permiso para reutilizar contenidos, puedes filtrar múltiples sitios para que no sean tenidos en cuenta

Cuando tengas una lista de sitios que copian tus contenidos, es el momento de actuar contra ellos.

#7 Bloquear a los scrapers

Los scrapers se sirven de tu feed RSS para copiar tus contenidos. Pero si averiguas sus IPs puedes bloquearlos en tu servidor para impedirles el acceso. Para ello, inserta el siguiente código en el archivo .htaccess:

Order allow, deny
Deny from 192.0.2.1/24
Allow from all

Ahora bien, hay un par de situaciones en las que este método no funciona. La primera es cuando usas un servicio como Feedburner, ya que los scrapers acceden a otro servidor. La segunda es cuando los scrapers operan desde una IP diferente al dominio donde publican el contenido. Así que no es infalible.

También te puede interesar:

# 8 Mostrar los derechos de copyright

Una forma de evitar el robo de contenido es mostrar en un lugar destacado los derechos de copyright por los que regla tu contenido. Esto, por lo general, no detendrá a los ladrones de contenido, pero va a disuadir a muchos usuarios que quieran copiar tu contenido. Muchos usuarios todavía no entienden que, sólo porque algo está público en la web, esto no lo hace de dominio público o que lo pueda usar cualquiera para sus propios fines. En ciertas ocasiones, un recordatorio es todo lo que necesitarás.

# 9 Usar marca de agua en tu contenido

Usa marca de agua en tus fotos y gráficos con tu marca o logotipo o algún tipo de texto que permita a todos saber de quién es ese contenido. Puedes hacer esto con casi cualquier programa para procesar imágenes que tengas en tu ordenador. Sino quieres poner un logo, puedes crear la marca de agua con el enlace a tu página web. Esto permitirá que los visitantes al sitio infractor sepan que están robando el contenido y destruyan cualquier credibilidad que tuviesen.

#10 Manejar las crisis con cabeza

Si has seguido los consejos tu contenido estará mucho más seguro que antes. Sin embargo, si ya te han robado el contenido puedes hacer lo siguiente:

  • Establecer contacto: Este debería ser siempre el primer paso. Si no consigues que eliminen el contenido, intenta obtener al menos un enlace al artículo original. De esta forma será más fácil que tanto Google como los usuarios puedan identificar al autor real del contenido
  • Solicitar la eliminación del resultado: Cuando la comunicación falla otra opción es pedir a Google que elimine el contenido de sus resultados. Si además resulta que el contenido copiado te rebasa en los rankings, puedes enviar un reporte de contenido copiado. Éste último no eliminará el resultado, pero ayudará al buscador a mejorar la detección de copias
  • No hacer nada: Si las páginas con contenido copiado no superan a las tuyas en el buscador quizá no te interese emprender ninguna acción. Todo dependerá de si aceptas o no el uso que estén haciendo de tus contenidos
  • Hacer ping con Pubsubhubbub y mostrar que eres es el creador de contenido original. Esto protege tus intereses y en ocasiones puede llegar al delincuente a eliminar su contenido.
  • Uilizar TinEye hacer una búsqueda de imágenes para encontrar las páginas web que estén mostrando tus imágenes sin tu permiso y solicitarles que añadan un enlace a tu página web para la atribución

Es importante explorar la página web con regularidad para asegurarte de que tu contenido no está siendo o ha sido robado por personas que no tienen permiso para usarlo. Que no se te olvide usar herramientas como Plagium, GrammarlyCopyscape o servicios similares. Por otro lado, es bueno pensar que si alguien está robando tus contenidos es porque estos merecen la pena. Obviamente no es la mejor manera de recibir el cumplido, pero al menos es una señal de que lo estás haciendo bien, ¿no crees?

¿Tiene algún truco más que añadir que he haya funcionado para evitar que te copien el contenido? Dímelo en los comentarios y que no se te olvide compartir en las redes sociales.

¿Te ha gustado el contenido?

Puntuación media 5 / 5. Votos: 52

¡Todavía no hay votos! Sé el primero en valorar el contenido.

¿Te ha gustado? Comparte el contenido
Publicado por Ignacio Santiago

Soy muchas cosas, pero todo empezó como blogger hace más de 20 años. Desde ahí he ido ido creciendo como persona y profesional hasta que decidí dejar un buen trabajo, emprender por mi cuenta y poner en marcha mi propia agencia de marketing digital. Ahora, junto con un equipo joven, motivado y muy cualificado, ayudo a profesionales y empresas a crear y hacer crecer su negocio en Internet ofreciendo un servicio de marketing digital atento, cercano, integral y profesional.

Contenidos relacionados
Deja tu comentario
Suscríbete y estate al día en marketing digital

Únete a más de 50.000 personas que, aparte de recibir los primeros todas las actualizaciones del blog e importantes descuentos en herramientas, tienen acceso gratuito a todos nuestros contenidos.

servicios marketing digital diseño web wordpress seo fondo
servicios marketing digital diseño web wordpress seo fondo
Suscríbete y estate al día en marketing digital

Únete a más de 50.000 personas que, aparte de recibir los primeros todas las actualizaciones del blog e importantes descuentos en herramientas, tienen acceso gratuito a todos nuestros contenidos.