Google Panda: La megaguía para enterderlo y hacerle frente

>Google Panda: La megaguía para enterderlo y hacerle frente
Google Panda: La megaguía para enterderlo y hacerle frente 2016-10-14T14:03:11+00:00

Al adorable algoritmo de Google, Google Panda, le conocimos en febrero de 2011. Su nacimiento se debió a la necesidad de Google de seguir ofreciendo resultados de búsqueda de calidad, asi que antes había que combatir las páginas web de baja calidad. En este artículo voy a analizar a fondo Google Panda y todo su ecosistema, aunque a lo mejor necesitas más información sobre todos los cambios de los algoritmos de Google.

Índice

Esta página esta continuamente actualizándose. Vuelve de vez en cuando :)

Qué es Google Panda

Google Panda es una actualización del algoritmo de clasificación de los resultados de búsqueda creado principalmente por Navneet Panda (de ahí su nombre). Apareció por primera vez en febrero del año 2011 como hemos mencionado anteriormente para combatir los sitios de baja calidad. En su salida, afectó a más de un 12% de todos los resultados de búsqueda.

Google Panda se justifica por la proliferación masiva de páginas web con contenidos de baja calidad (o sitios web spam) en los años previos a su aparición. Sólo la ínfima minoría de las páginas webs que se publicaban tenía una calidad decente. ¿En cuanto al resto? Sus propósitos eran bien simples: posicionar palabras clave como fuera en los rankings de búsqueda a base de copiar contenido de otros autores o redactar contenido claramente sobreoptimizado para unas determinadas keywords, y mediante estas primeras posiciones, conseguían atraer tráfico al sitio, que además de tener contenido de baja calidad, estaban sobrecargados de publicidad.

Las sucesivas actualizaciones de Panda han puesto un mayor énfasis en mejorar el reconocimiento de la relevancia de una página web. Google Panda penaliza a páginas:

  1. google pandaQue copian contenido de terceros
  2. Que no aportan valor al usuario
  3. Que tienen un exceso de anuncios
  4. Que entorpecen la navegación del usuario

Con Google Panda debes ser estar seguro de:

  1. Que tu contenido es totalmente original
  2. Que aportas un gran valor a tu usuario
  3. Que mantienes la página web actualizada
  4. Que buscas nuevos formatos para enriquecer tu aportación al usuario

Las métricas más reconocibles en este caso serán:

  1. El porcentaje de rebote por página
  2. El CTR en tus resultados de búsqueda
  3. El tiempo de permanencia
  4. El número de páginas vistas

Si no estás muy seguro de la calidad del contenido que tienes, una revisión del mismo y del nuevo nunca estaría de más.

Volver al índice

Cambios del algoritmo Google Panda

Última actualización el 20 de mayo de 2014

Panda es uno de los algoritmos más sonados, diseñado para combatir el contenido de baja calidad en los resultados del buscador.

Por un lado, sanciona a sitios que ofrecen contenido pobre, granjas de contenido y sitios con un ratio de anuncios excesivo. Mientras que por otro lado, recompensa a aquellos que crean contenido único y relevante para sus usuarios.

La primera actualización afecta al 11.8% de las consultas en inglés y desde entonces se producen actualizaciones cada pocas semanas. En agosto de 2011 comienza a tratar las consultas en español, con un impacto de entre el 6 y el 9%.

Actualmente se integra en el núcleo de Google, donde se sigue actualizando una vez al mes aproximadamente. Google dejó de confirmar las actualizaciones de Panda en julio de 2013.

Este es el historial de actualizaciones de Google Panda. Las que están marcadas (*) son actualizaciones no oficiales basadas en los estudios de Glenn Gabe y otras fuentes.

  • Panda 37 (24 de octubre de 2014) – Actualización no confirmada, lanzada durante el despliegue de Penguin 3.0 y el algoritmo de Piratería. Sus efectos se atribuyen inicialmente a Penguin pero al final se descubre que los sitios afectados tenían o habían tratado problemas relacionados con la calidad del contenido. La actualización revela la confusión que puede llegar a crear el cruce de algoritmos y anticipa las dificultades que en adelante ocasionarán las actualizaciones en tiempo real.
  • Panda 36 (25 de septiembre de 2014) – Alias Panda 4.1. El despliegue comienza a principios de semana y tardará una semana más en estar completo. El algoritmo incorpora nuevas señales que le permitirán detectar contenido de baja calidad con mayor precisión. Como resultado, más pequeños y medianos sitios de gran calidad podrán rankear mejor.
  • Panda 35 (5 de septiembre de 2014) – Actualización no confirmada
  • Panda 34 (20 de mayo de 2014) – Gran actualización presentada por Matt Cutts como Panda 4.0. Afecta a un 7.5% de las consultas en inglés, mientras que para otros idiomas lo hace en diferentes grados (no revelados). Una semana después Matt habla de una arquitectura “más amable” que prepara el terreno para futuras iteraciones.
  • Panda 33 (24 de marzo de 2014) – Actualización no confirmada
  • Panda 32 (11 de febrero de 2014) – Actualización no confirmada
  • Panda 31 (11 de enero de 2014) – Actualización no confirmada
  • Panda 30 (17 de diciembre de 2013) – Actualización no confirmada
  • Panda 29 (18 de noviembre de 2013) – Actualización no confirmada
  • Panda 28 (16 de septiembre de 2013) – Actualización no confirmada
  • Panda 27 (26 de agosto de 2013) – Actualización no confirmada
  • Panda 26 (18 de julio de 2013) – Pese a la negativa de Google a mencionar nuevas actualizaciones de Panda, confirman la incorporación de nuevas señales al algoritmo para mejorar su precisión.
  • Panda 25 (14 de marzo de 2013) – Según Matt Cutts, será la última actualización oficial de Panda. A partir de entonces, Panda se integra en el núcleo algorítmico de Google.
  • Panda 24 (22 de enero de 2013) – La primera actualización oficial en 2013. Afecta al 1.2% de las consultas en inglés.
  • Panda 23 (21 de diciembre de 2012) – Afecta al 1.3% de las consultas en inglés.
  • Panda 22 (21 de noviembre de 2012) – Una leve actualización que afecta al 08% de las consultas en inglés.
  • Panda 21 (5 de noviembre de 2012) – Una leve actualización que afecta al 1.1% de las consultas en inglés. A nivel mundial, afecta sólo al 0.4%.
  • Panda 20 (27 de septiembre de 2012) – Se solapa con la actualización de Dominios de Concordancia Exacta (EMD) y tiene un gran impacto. Afecta al 2.4% de las consultas en inglés.
  • Panda 19 (18 de septiembre de 2012) – Una leve actualización que afecta al 0.7% de las consultas.
  • Panda 18 (20 de agosto de 2012) – Una leve actualización que afecta aproximadamente al 1% de las consultas.
  • Panda 17 (24 de julio de 2012) – Causa fluctuaciones en los rankings durante unos días, aunque mínimas. Afecta aproximadamente al 1% de las consultas.
  • Panda 16 (25 de junio de 2012) – Una leve actualización que afecta aproximadamente al 1% de las consultas.
  • Panda 15 (9 de junio de 2012) – Una actualización con mayor impacto que las dos anteriores. Afecta al 1% de las consultas.
  • Panda 14 (27 de abril de 2012) – Una actualización de impacto mínimo.
  • Panda 13 (19 de abril de 2012) – Una actualización de impacto mínimo.
  • Panda 12 (23 de marzo de 2012) – Google anuncia esta actualización vía Twitter. Afecta aproximadamente al 1.6% de las consultas.
  • Panda 11 (27 de febrero de 2012) – Una actualización de impacto mínimo.
  • Panda 10 (18 de enero de 2012) – Una actualización de impacto mínimo.
  • Panda 9 (18 de noviembre de 2011) – Tras esta actualización Google empieza a hacer cambios más frecuentes en Panda, pero de menor impacto. Este en concreto, afecta a menos del 1% de las consultas.
  • Panda 8 (19 de octubre de 2011) – Matt Cutts anuncia esta actualización vía Twitter. Afecta al 2% de las consultas, aproximadamente.
  • Panda 7 (28 de septiembre de 2011) – Aunque se trata de una actualización de impacto despreciable, algunos sitios informan de grandes cambios en los rankings.
  • Panda 6 (12 de agosto de 2011) – Panda es oficialmente desplegado a nivel mundial (incluyendo España). Tiene un gran impacto, de entre el 6 y el 9% de las consultas.
  • Panda 5 (23 de julio de 2011) – Una actualización de impacto mínimo.
  • Panda 4 (16 de junio de 2011) – Una actualización de impacto mínimo.
  • Panda 3 (10 de mayo de 2011) – Una actualización de impacto mínimo.
  • Panda 2 (11 de abril de 2011) – El despliegue oficial de Panda a nivel internacional para países de habla inglesa (no EEUU). Afecta al 2% de las consultas.
  • Panda 1 (24 de febrero de 2011) – Primera versión de Panda, destinada a consultas en inglés en EEUU. Pese a su anuncio, coge por sorpresa a casi toda la comunidad SEO. Afecta a un 11.8% de las consultas.
Volver al índice

Guía para recuperarse de Google Panda

#1 Confirma cuál de las actualizaciones te afecta

Al llevar a cabo la auditoría de una página web afectada por Google Panda, lo primero que hay que hacer es tratar de confirmar en qué actualización salió afectado el tráfico del sitio y de qué magnitud.

A menudo este ejercicio revela datos curiosos, pero la realidad es que hay algunas páginas web que han podido ser penalizadas por una actualización, se han beneficiado de una actualización de datos y después han vuelto a ser penalizadas por una nueva actualización. Sabiendo la actualización específica que ha penalizado una página web es muy útil para determinar la razón de la penalización. Lo mejor es que conozcas en profundidad la penalización de Google.

#2 Audita la página web

Cuando tratamos que crear una plan para recuperarnos de una penalización de Google Panda es importante tener una visión clara de la situación, para evaluar todo lo que podría ser la causa de la penalización. Esto impide que llegues a conclusiones como “Tengo un alto porcentaje de abandonos, ¡Tengo que arreglar esto de inmediato!”, cuando en realidad, la penalización puede estar relacionada con el contenido duplicado, la velocidad de carga de la página o cualquier otra cosa. Aquí te voy a mostrar una extensa lista de factores SEO que vas a tener que evaluar como parte de la auditoría para detectar una posible penalización de Google Panda.

Si no te ves capaz por ti mismo, consulta mis servicios de consultoría.

Muchos de éstos puntos derivan de las pautas de recuperación de Google Panda, que aconsejan que una página web debe cumplir con una serie de directrices o contestar a una serie de preguntas para ser considerados de alta calidad:

  • ¿Confías en la información presentada en este artículo?
  • ¿Este artículo ha sido escrito por un experto, por una persona entusiasta que conoce bien el tema, o es más bien superficial?
  • ¿Contiene el sitio artículos duplicados, solapados o redundantes sobre el mismo tema o temas parecidos que contengan ligeras variaciones de palabras clave?
  • ¿Te sentirías a gusto si tuvieses que dar los datos de tu tarjeta de crédito en este sitio?
  • ¿Contiene este artículo errores de ortografía, estilísticos o de facto?
  • ¿Están los temas impulsados genuinamente por el interés de los lectores del sitio, o el sitio genera contenido en un intento por adivinar con qué se podría lograr una buena clasificación en los motores de búsqueda?
  • ¿Proporciona el sitio contenido o información original, informes originales, investigación original o análisis originales?
  • ¿Proporciona la página un valor sustancial en comparación con otras páginas que aparecen en los resultados de las búsquedas?
  • ¿Cuánto control de calidad se realiza sobre el contenido?
  • ¿Describe el artículo las dos caras de cada historia?
  • ¿Es el sitio una autoridad reconocida en el tema?
  • ¿Está el contenido generado en masa por un gran número de redactores o repartido en una amplia red de sitios, de modo que cada página o sitio individual no reciben demasiada atención ni cuidados?
  • ¿Está el artículo bien editado o parece producido de forma descuidada o con prisas?
  • ¿Para realizar una consulta sobre salud, confiarías en la información de este sitio?
  • ¿Reconocerías este sitio como fuente autorizada al mencionar su nombre?
  • ¿Proporciona este artículo una descripción completa y detallada del tema?
  • ¿Contiene este artículo un análisis detallado o información relevante más allá de lo obvio?
  • ¿Se trata del tipo de página que desearías guardar en tus marcadores, compartir con un amigo o recomendar a alguien?
  • ¿Contiene este artículo una cantidad excesiva de anuncios que distraigan o interfieran con el contenido principal?
  • ¿Esperarías ver este artículo impreso en una revista, una enciclopedia o un libro?
  • ¿Son los artículos cortos, insustanciales o carecen de algún otro modo de detalles específicos útiles?
  • ¿Están las páginas editadas con mucho cuidado y atención por el detalle o con poca atención?
  • ¿Se quejarán los usuarios al ver páginas del sitio?

I usually like to sum up this audit with a prioritised one-pager of actions. It can be tough knowing which fixes are more important than others, so i’m going to go through some of the things that I find typically appear at the top of the list.

A mi me gusta resumir esta auditoría con una página de las acciones más importantes. Puede ser difícil saber qué revisiones son más importantes que otras, así que voy vamos a ver algunos de los puntos que en mi opinión son críticos:

Arquitectura web óptima

Existen muchas razones por las que querrás mejorar la arquitectura de tu página web después de una penalización. En primer lugar porque una estructura de una página web clara mejorará la indexación, permitiendo a Google detectar cualquier cambio y actualizar el índice en menos tiempo y más a menudo. También ayudará a los usuarios navegar por tu página web mejor, lo que debería ser evidente en los factores de comportamiento (porcentaje de abandonos más bajo, más tiempo en la página, etc.)

Las reglas de oro cuando se trata de arquitectura web son:

  • Ninguna página debe tener más de 100 enlaces (la suma de internos y externos)
  • Ninguna página debe ser estar a más de 3 clicks de la página de inicio (es decir, “la jerarquía de tu página web debe ser lo más plana posible)
  • La navegación debe ser clara e intuitiva para el usuario

También querrá asegurarte de que tu página web no esté llena de enlaces rotos y páginas con error 404. Esto no sólo hace que la navegación por la página provoque un dolor de cabeza para el usuario, sino que también dificulta la indexación. Para comprobar si hay enlaces rotos o errores 404, recomiendo el uso de Screaming Frog o Xenu para hacer un rastreo del sitio, pero también comprobar la sección “Errores de rastreo” en las Herramientas para Webmasters de Google.

Contenido duplicado externo

Al igual que una buena arquitectura web, el contenido duplicado ofrece valor añadido al usuario, y suele ser el gran culpable de causar las penalizaciones de Google Panda. En términos generales, hay dos tipos de contenido duplicado: externo e interno.

El contenido duplicado externo consiste básicamente en que varios dominios muestren el mismo contenido, y por lo tanto es trabajo de Google identificar qué página web es la fuente original, o cual de ellas ofrece valor añadido.

En mi experiencia, la mejor manera de combatir este tipo de contenido duplicado es contratar a uno o varios redactores que te escriban varios artículos de entre 300-500 palabras por página  (si tienes un volumen bajo de páginas duplicadas). De todas maneras las páginas que suelen estar afectadas por contenido duplicado externo tienden a tener mucho contenido, por lo esta solución no sería asequible. En esos casos, es necesario hacerse fuerte y usar inteligentemente los datos de los que se disponen. Recogiendo datos de APIs y bases de datos relevantes deberías ser capaz de generar un párrafo único y relevante en cada página que hará que dará como resultado ser “diferente” a los demás. No es la solución ideal, pero estoy seguro de que funciona y te puede ayudar.

Contenido duplicado interno

El contenido duplicado interno viene en muchas formas y tamaños. En primer lugar no es un tipo de contenido duplicado basado en URLs. Aquí es cuando diferentes direcciones URL muestran el mismo contenido. En primer lugar está la cuestión de la capitalización de las URL, y para entenderlo vamos a verlo con un ejemplo:

  • https://ignaciosantiago.com/tienda/Consultoria-SEO
  • https://ignaciosantiago.com/tienda/CONSULTORIA-SEO

Todas estas direcciones URL muestran el mismo contenido.

En lo que se refiere a Google, si cada una de estas direcciones URL consigue ser enlazada, pueden ser indexadas y consideradas como páginas diferentes que muestran el mismo contenido, es decir, contenido duplicado. Del mismo modo, cuando una URL no tiene etiqueta canonical adecuada entre la versión de la página con www y la de sin www, esto puede también crear problemas del mismo estilo.

http://tusitio.com should tiene que redirigir hacia (o viceversa)

Si bien todas estas cuestiones deberían resolverse utilizando respuestas de servidor correctas, también es recomendable tener etiquetas rel=”canonical” para asegurarte de que Google sabe qué página deberían estar indexando cada vez que hay alguna confusión.

Una de las formas más comunes de contenido duplicado son las etiquetas meta (las meta-tags en ingles). Esto es fácil de diagnosticar, ya que simplemente con acceder a las Herramientas para Webmasters de Google y mirar en la sección “Mejoras de HTML” en la pestaña Aspecto de la Búsqueda. Lo ideal sería no tener ningún duplicado, título corto o metadescripción.

Contenido Thin o de baja calidad

Por lo general, la razón más típica de una penalización de Google Panda es porque existe una cantidad significativa de contenido de mala calidad en la página web. Estas son páginas que agregan poco valor para el usuario, o no contienen suficiente información. Por ejemplo, hay páginas que busques lo que busques tendrás que hacer scroll, e incluso llegar a tener que navegar a través de las página de resultados para encontrar lo que buscas.

Esto no ofrece ningún valor para el usuario, por lo que esa página no debería clasificar para ese término de búsqueda específico. Para ver si esto podría estar afectando a mi página web, haz una búsqueda en el sitio desde Google (site: www.tudominio.com) y comprueba la cantidad de páginas de baja calidad que aparecen. Si no tienes…¡Genial!… Al siguiente punto…

Velocidad de carga

Google siempre ha dejado muy claro que el tiempo de carga de una página web puede obstaculizar el posicionamiento en los resultados de búsqueda. Por si eso no fuese suficiente, hay muchos casos de estudio que demuestran cómo la velocidad de la página está vinculada a su tasa de conversión.

Recomiendo el uso de Pingdom y GTMetrix para diagnosticar la velocidad de carga de las páginas de tu página web. La regla general es mantener el tiempo máximo de carga en 2 segundos. Algo que te darás cuenta al optimizar la velocidad de carga de una página web es que los widgets externos se suelen convertir en un dolor de cabeza, sobretodo en instalaciones wordpress. Si estás utilizando gran cantidad de widgets incrustados (formularios de suscripción de correo electrónico, plugins sociales, deslizadores de contenido, etc), estos a menudo pueden ser los culpables de la “desaceleración” de tu página web. Intenta mantener el número de peticiones DNS externas al mínimo, siempre dentro de lo posible.

Volver al índice

#3 Arregla todo y espera

Una vez que estés absolutamente seguro de que no hay nada más que puedas hacer para mejorar tu página web, es el momento de sentarse y esperar. Durante este proceso, en el cual mejoras la velocidad de carga de tu web, eliminas contenido duplicado, etc, puedes llegar a ver un ligero aumento en el tráfico y el rendimiento de la página web, pero nada significativo. Hasta que Google no vuelva a ejecutar su algoritmo en una actualización o volverás a ver tus niveles de tráfico tal y como estaban antes de ser penalizado por  Google Panda. Para ello mira la lista de actualizaciones de nuevo.

Conclusión

He escrito este artículo tan largo, porque sé lo que se siente al tener una página web afectada Google Panda. Espero que esta información te haya ayudado a desarrollar ideas viables que puedan poner las cosas de nuevo en marcha. Por supuesto, si tienes alguna pregunta no dudes en escribir tu comentario, aunque también estoy en las redes sociales. Si tienes mucha prisa mándame un correo.

Volver al índice

Valora el contenido por favor

 

A otros usuarios les intereso…

[/fusion_builder_column][/fusion_builder_row]

2 Comentarios

  1. Joel 26/05/2015 en 11:34

    Es una locura panda y sus actualizaciones. Siempre tienes que estar a la última para poder llevar bien tu sitio web.

    Saludos

    • Ignacio Santiago
      Ignacio Santiago 29/05/2015 en 21:05

      Muchas gracias por tu comentario Joel. Google Panda vino para complicarnos la vida un poco, pero al fin y al cabo persigue la calidad de las búsquedas de google.

No se permiten comentarios.