Blog

Filtran más de 2.500 páginas de documentos internos de Google

La reciente filtración de la documentación interna de la API Content Warehouse de Google ofrece una visión sin precedentes de los mecanismos que se esconden tras los algoritmos de clasificación del gigante de las búsquedas. Para las agencias de marketing digital especializadas en optimización de motores de búsqueda (SEO), estas revelaciones son significativas y aplicables. Este extenso análisis explora las principales conclusiones y sus implicaciones para nuestras estrategias de SEO.

Verificación de la autenticidad de la supuesta filtración de la API

Aunque no dispongo de información privilegiada directa, los informes sugieren que algunos antiguos empleados de Google han revisado los documentos filtrados y los han considerado auténticos y coherentes con la documentación interna y las normas de codificación de Google. Sin embargo, sus valoraciones se basaban en revisiones iniciales y se facilitaron de forma anónima.

La fuente de la filtración parece ser GitHub, y la teoría más creíble es que estos documentos se hicieron públicos involuntariamente y por poco tiempo. Numerosos enlaces en la documentación conducen a repositorios privados de GitHub y a sitios internos de Google que requieren inicios de sesión específicos y acreditados por Google. Durante esta exposición pública probablemente accidental entre marzo y mayo de 2024, la documentación de la API se distribuyó a Hexdocs (que indexa repositorios públicos de GitHub) y luego fue encontrada y difundida por otras fuentes. Es evidente que otros tienen copias, aunque es extraño que no haya surgido ningún discurso público hasta ahora.

Principales conclusiones de la filtración

NavBoost y utilización de datos de clics:

  • El sistema NavBoost, empleado desde mediados de la década de 2000, recopila y analiza datos exhaustivos de clics para determinar la relevancia y la clasificación de las páginas web en función de las interacciones de los usuarios. Métricas como los clics largos (que indican satisfacción del usuario) frente a los clics cortos (que indican insatisfacción) son fundamentales.
  • Google aprovecha los datos de su barra Google y, más tarde, del navegador Chrome, para obtener información detallada sobre el comportamiento de los usuarios, que se utiliza para refinar los resultados de las búsquedas.

Integración de datos del navegador Chrome:

  • Google utiliza los datos de los usuarios de Chrome para evaluar la popularidad y relevancia de las páginas web. Un alto índice de participación de los usuarios de Chrome puede mejorar significativamente la clasificación de un sitio en las búsquedas.
  • Métricas como «topUrl» utilizan los datos de clics de Chrome para identificar las páginas más importantes de un sitio para los enlaces de sitio en los resultados de búsqueda.

Calidad de los contenidos y evaluadores humanos:

  • La plataforma EWOK permite que evaluadores de calidad humanos proporcionen comentarios que se integran directamente en los algoritmos de búsqueda de Google. Estas evaluaciones ayudan a determinar la relevancia y la calidad de los contenidos web.
  • Los datos de los evaluadores humanos influyen en varias señales de calidad, lo que repercute en la forma en que el contenido se clasifica y se muestra en los resultados de búsqueda.

Prácticas de lista blanca:

  • Google emplea listas blancas para sectores específicos como los viajes, la información COVID-19 y el contenido relacionado con las elecciones para garantizar la fiabilidad y la precisión de la información presentada en los resultados de búsqueda.
  • Al mantener listas blancas, Google se asegura de que sólo aparezcan fuentes creíbles y autorizadas para consultas sensibles o de alto riesgo.

Segmentación geográfica y por dispositivos:

  • Google segmenta los datos de clics por ubicación geográfica y tipo de dispositivo. Esto significa que el SEO local y la optimización para móviles son más importantes que nunca para lograr una buena clasificación.
  • Adaptar el contenido a las necesidades del público local y optimizarlo para los usuarios móviles puede suponer una ventaja competitiva significativa.

Autoridad de marca y análisis a nivel de dominio:

  • Las marcas establecidas reciben un trato preferente en los rankings de búsqueda. Construir una marca fuerte y reconocible tanto online como offline es esencial para el éxito del SEO.
  • Google evalúa las interacciones de los usuarios tanto a nivel de dominio como de consulta, y potencia los sitios que satisfacen sistemáticamente la intención del usuario en múltiples consultas.
Actualización (29/5): a fuente anónima ha decidido revelarse. Este vídeo confirma su identidad como Erfan Azimi, profesional del SEO y fundador de EA Eagle Digital.

Información sobre la documentación del almacén de contenidos de la API de Google

La documentación ofrece una gran cantidad de información detallada sobre diversos atributos y funciones de los sistemas internos de Google, entre los que se incluyen:

Métricas de compromiso de los usuarios:

  • Atributos como goodClicks, badClicks, lastLongestClicks e impresiones proporcionan información detallada sobre las interacciones de los usuarios, lo que ayuda a Google a determinar la calidad de la interacción de los usuarios con los resultados de búsqueda y a influir en las decisiones de clasificación.
  • Google realiza un seguimiento de las acciones específicas de los usuarios para medir la intención y la satisfacción, como los clics largos frente a los clics cortos.

Segmentación y localización de datos:

  • La capacidad de Google para segmentar los datos por ubicación geográfica y tipo de dispositivo se pone de manifiesto en atributos como geoFenceClicks y geoFenceImpressions, que permiten obtener resultados de búsqueda más precisos y localizados.
  • Los atributos distinguen entre el comportamiento de los usuarios móviles y de escritorio, lo que garantiza que los resultados de búsqueda se optimicen para el dispositivo del usuario.

Evaluaciones de la calidad de los contenidos:

  • Los atributos pageQualityScore y documentQualityScore reflejan el modo en que Google evalúa la calidad general de una página web o de un documento a partir de las métricas de participación de los usuarios y de los comentarios de los evaluadores humanos.
  • La documentación hace hincapié en el papel de los evaluadores humanos a la hora de proporcionar evaluaciones de calidad que alimentan estas puntuaciones, subrayando la importancia de alinear el contenido con las directrices de calidad de Google y las expectativas de los usuarios.

Señales de nivel de consulta:

  • Atributos como querySatisfactionScore miden en qué medida un resultado de búsqueda satisface la intención del usuario, influidos por las métricas de clics, las tasas de participación y los comentarios de los usuarios.
  • Los algoritmos de Google pueden reconocer y adaptarse a los distintos tipos de intención del usuario, como las consultas informativas, de navegación o transaccionales. Optimizar el contenido para satisfacer estas intenciones puede mejorar el rendimiento de las búsquedas.

Análisis del flujo de clics:

  • Atributos como navigationClicks y backClicks rastrean cómo navegan los usuarios por los resultados de búsqueda y las páginas web, lo que ayuda a Google a comprender los patrones de comportamiento de los usuarios y a ajustar las clasificaciones en consecuencia.
  • Al analizar la secuencia de clics, Google puede identificar tendencias y preferencias en el comportamiento de los usuarios, lo que sirve de base para sus decisiones de clasificación.

Spam y control de calidad:

  • Atributos como spamScore y linkSpamScore indican cómo Google identifica y mitiga el contenido y los enlaces spam. Es fundamental mantener un perfil de backlinks limpio y evitar las tácticas de SEO de sombrero negro.
  • Google emplea varios mecanismos para garantizar la calidad de los resultados de búsqueda, incluida la penalización de los sitios con puntuaciones de spam elevadas y la promoción de aquellos con señales de calidad sólidas.

Implicaciones estratégicas de SEO

Mejorar la experiencia del usuario:

  • Mejorar los tiempos de carga de las páginas, garantizar la capacidad de respuesta en dispositivos móviles y ofrecer contenido valioso y centrado en el usuario es fundamental para impulsar las métricas de participación, que son indicadores clave utilizados por Google para clasificar las páginas.

Aprovechamiento de Chrome Insights:

  • Utilizar Google Analytics y Search Console para comprender el comportamiento de los usuarios, especialmente de los usuarios de Chrome, y optimizar las páginas con más tráfico basándose en estos datos.
  • Identificar y optimizar las páginas más visitadas para mejorar su rendimiento en los resultados de búsqueda.

Calidad de los contenidos y alineación de los evaluadores:

  • Realice auditorías de contenido periódicas para garantizar la alineación con los estándares de calidad de Google y los comentarios de los evaluadores.
  • Incorporar los comentarios de las encuestas y las valoraciones de los usuarios para mejorar continuamente la calidad y la relevancia de los contenidos.

SEO local y móvil:

  • Optimizar los perfiles de Google My Business, recopilar reseñas locales y crear contenido local relevante para mejorar la clasificación en las búsquedas locales.
  • Asegúrese de que los sitios web están totalmente optimizados para dispositivos móviles a fin de atender al creciente número de buscadores móviles.

Creación de marca:

  • Invierta en actividades de creación de marca, como campañas de relaciones públicas y participación en las redes sociales, para mejorar el reconocimiento y la autoridad de la marca.
  • Aproveche la prueba social y las reseñas positivas para construir una presencia de marca sólida y de confianza.

Control del spam y garantía de calidad:

  • Supervisar periódicamente los perfiles de vínculos de retroceso y el contenido para identificar y eliminar los elementos de spam, lo que ayuda a mantener una puntuación de calidad positiva y a evitar sanciones.
  • Implantar procesos rigurosos de control de calidad para garantizar que todos los contenidos cumplen los estándares de Google y aportan valor a los usuarios.

Resumen

En conclusión, la filtración del almacén de contenidos de la API de Google ofrece una visión sin precedentes de los algoritmos de búsqueda de Google, destacando la importancia de la participación de los usuarios, la calidad de los contenidos y la autoridad de la marca. Adaptando las estrategias a estos conocimientos, los profesionales del SEO pueden prestar un mejor servicio a sus clientes y lograr un éxito sostenido en la visibilidad y el rendimiento de las búsquedas.

Referencias:

Google API Content Warehouse Documentation

Secrets from the Algorithm: Google Search’s Internal Engineering Documentation Has Leaked – iPullRank

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *