Google lanzó recientemente un podcast hablando sobre el concepto de un presupuesto de rastreo y cómo afecta al índice de contenido de Google.
Gary Illyes y Martin Splitt proporcionaron detalles sobre cómo Google interpreta la indexación de sitios web.
Origen del término Presupuesto Crawl.
Gary Illyes mencionó que la noción de un presupuesto arrastrado fue ideada por la comunidad de búsqueda y no por Google.
Explicó que dentro de Google no existía algo interno que se pudiera comparar con la noción de un presupuesto flexible.
Cuando se mencionaba un presupuesto de arrastrar, en realidad se referían a una serie de métricas que se estaban utilizando en Google, no a un presupuesto específico denominado “de arrastrar”.
Texto parafraseado: Por lo tanto, en Google discutieron sobre lo que podría significar un presupuesto inicial y encontraron una forma de referirse a él.
Expresó:
“… por un período de tiempo prolongado durante el cual afirmábamos no tener la noción de un presupuesto acumulativo. Y esto resultó ser cierto.”
No teníamos algo que pudiera representar manejar el presupuesto por sí mismo, al igual que no contamos con un número de EAT, por ejemplo.
Y así, debido a que la gente lo mencionaba, tratamos de crear algo… al menos, de cierta manera concreta.
Después, colaborábamos con varios equipos, no estoy seguro de cuántos, con el objetivo de identificar algunas métricas internas que pudieran combinarse para crear lo que la gente externamente reconocería como un presupuesto coherente.
El significado del presupuesto de Crawl en Google.
Según Gary, al calcular un presupuesto de rastreo, se tienen en cuenta aspectos prácticos como el número de URLs que Googlebot puede visitar sin saturar el servidor.
Gary Illyes y Martin Splitt son dos expertos en SEO que han trabajado juntos en varios proyectos relacionados con el posicionamiento en buscadores.
Gary Illyes explica que el rastreo de Google se define como la cantidad de URLs que el Googlebot puede y está dispuesto o es instruido a explorar.
Martin Splitt habla sobre un sitio web en particular.
Gary Illyes: Sí, en el caso de un sitio web específico.
Para nosotros, es importante comprender lo que implica el presupuesto de rastreo, ya que no deseamos perjudicar los sitios web debido a la capacidad de Googlebot, que es similar a la de Chrome y puede afectar negativamente a los sitios.
Balance de diversas consideraciones.
Otro aspecto destacado fue la discusión acerca de las diversas consideraciones relacionadas con los arrastres. Según Google, existen restricciones en cuanto a la cantidad de almacenamiento disponible, lo que se traduce en la necesidad de utilizar los recursos de Google de manera estratégica.
Martin Splitt menciona que es común que todos deseen que sus sitios web sean indexados rápidamente, ya sea un sitio nuevo o uno con muchas páginas que se actualizan con frecuencia, y que se preocupan por la velocidad a la que los motores de búsqueda rastrean su contenido.
Por lo general, lo defino como un desafío en encontrar el equilibrio entre no sobrecargar el sitio web y también utilizar nuestros recursos de manera efectiva.
John Mueller mencionó recientemente en un tweet que Google no indexa todos los contenidos y destacó que no todo resulta útil.
El mensaje en Twitter de Mueller.
Es relevante considerar que Google no indexa todas las páginas de la web, incluso si se muestran directamente. En caso de no haber errores, es posible que eventualmente sea seleccionada para ser indexada, o Google podría priorizar otras páginas de su sitio.
Continuó con otro mensaje en Twitter.
“Muchos sitios dedicados al SEO generan contenido de mala calidad que no debería ser considerado para indexar. Solo por estar presente no garantiza que sea beneficioso para los usuarios”.
- Martin Splitt se refiere a la acción de trasladar un tema como “redirigir nuestros recursos a lo que realmente importa”.
- John Mueller comentó sobre la utilidad del contenido para los usuarios.
La utilidad es un aspecto importante para evaluar el contenido y en mi punto de vista, puede ser más efectiva para evaluar el contenido que seguir consejos vacíos sobre cómo asegurarse de que el contenido cumpla con las expectativas del usuario y esté optimizado en términos de palabras clave.
Por ejemplo, recientemente examiné un sitio web de YMYL en el que todo parecía haber sido diseñado siguiendo una lista de verificación de SEO.
- Elaborar un perfil de escritor.
- El perfil del autor necesita contar con un perfil en LinkedIn.
- Las palabras clave aumentan la cantidad de visitas al sitio web.
- Vínculo a páginas de gran prestigio.
El editor estaba empleando imágenes creadas por inteligencia artificial para la biografía del autor, la cual también fue utilizada en un perfil falso en LinkedIn.
Muchas de las páginas web enlazadas desde páginas .gov que contienen palabras clave en el título resultan ser poco útiles. Pareciera que no se tomó en cuenta la calidad de la página gubernamental antes de establecer el enlace.
En el exterior, se encontraban marcando las casillas de una lista de verificación de SEO que debían completar, como realizar actividades de SEO como la creación de enlaces hacia un sitio web .gov, establecer un perfil de autor, entre otras tareas.
Ellos se enfocaron en la apariencia de alta calidad sin realmente lograrlo, ya que no evaluaron la utilidad de sus acciones en cada etapa del proceso.
El presupuesto de la película Crawl no es motivo de preocupación.
Gary y Martin discutieron sobre cómo la mayoría de los sitios no tienen que considerar el costo de los rastreadores.
Gary apuntó con el dedo a los blogs de la industria de búsqueda que anteriormente promovieron la noción de que el presupuesto de los rastreos es un tema del que preocuparse, a pesar de que él considera que no es algo por lo que preocuparse.
Expresó:
Creo que la incertidumbre sobre eventos incontrolables y la falta de información precisa contribuyen en parte a este sentimiento de miedo.
… En el pasado, se mencionaban algunos blogs donde se discutía la relevancia del presupuesto de arrastre, generando confusión en las personas sobre si era algo por lo que debían preocuparse o no.
Martin Splitt hizo una pregunta.
“Imaginemos que tienes un blog atractivo… ¿Debes ocuparte del presupuesto?”
Y la respuesta de Gary fue la siguiente:
“Considero que la mayoría de las personas no deben inquietarse al respecto, y cuando menciono la mayoría, me refiero probablemente a más del 90% de los sitios en la red que no tienen que preocuparse por ello.”
Unos minutos después, durante el podcast, Martin comentó:
“Pero hay inquietud entre la gente al respecto, y no estoy completamente seguro de su origen.”
Creo que se debe a que en ciertos sitios web muy grandes se publican artículos y blogs en los que se discute el tema del presupuesto, lo cual es relevante.
Se está debatiendo en sesiones de formación sobre SEO. Según mi observación, también se está debatiendo en eventos y conferencias.
Es una situación poco común, como si no fuera algo que experimenta cada página web, pero aun así causa mucha preocupación entre las personas.
Cómo Google decide qué páginas indexar.
Se produjo un debate sobre los elementos que provocan que Google incluya el contenido en su índice.
Gary menciona la importancia de indexar información que sea fácil de encontrar a través de búsquedas.
Gary Illyes es el autor del texto.
“… Dado que nuestra capacidad de almacenamiento es limitada, nos interesa catalogar contenido que consideramos relevante para los usuarios, basándonos en las señales que recibimos a través de nuestros algoritmos. Si no tenemos información sobre un sitio o URL específicos, ¿cómo podríamos saber que debemos incluirlos en nuestro índice?”
Gary Google Search, un escritor técnico central, fue seguido por Lizzi Sassman (@okaylizzi), quien habló sobre la posibilidad de determinar si es conveniente indexar nuevos contenidos a partir del resto del sitio web.
Algunas conclusiones que podrías sacar son, por ejemplo, si decides crear un blog nuevo en tu página principal y lo ubicas en un subdirectorio distinto, podemos analizar si es conveniente trasladar una gran cantidad de contenido de ese blog en función de todo el sitio.
Lizzi Sassman plantea la cuestión de si un blog, al ser un tipo de contenido más dinámico y actualizable con mayor frecuencia, podría considerarse una novedad en términos de noticias y todavía no se sabe con certeza cuán frecuente será su actualización.
Gary Illyes mencionó que es fundamental contar con una indicación inicial.
Lizzi Sassman: Y el comienzo es…
Gary Illyes habla sobre la deducción a partir de la página principal.
A continuación, Gary cambió de tema para tratar las señales de calidad. Éstas se referían a si las personas estaban interesadas en el producto o el sitio web.
Proporcionó una explicación.
No se trata únicamente de cuánto se actualiza, sino también de la calidad de las señales que posee la página principal.
Por ejemplo, si observamos que un cierto diseño es muy popular en línea, como un producto específico que tiene mucha demanda en Internet, y los usuarios de Reddit están debatiendo al respecto, mientras que otros sitios web están compartiendo enlaces con ese mismo diseño, entonces podemos interpretar que a las personas les gusta ese sitio en particular.
Gary sigue discutiendo acerca de la fama y las señales de atracción, pero dentro del marco de la charla, que forma parte de una sección recién estrenada en un sitio web.
En la conversación se hace referencia a la recién creada área denominada Directorio.
Puedes parafrasear el texto “Illyes” para que pueda ayudarte mejor? No puedo responder a una solicitud de parafraseo sin un texto específico para trabajar.
Cuando tienes algo que la gente no está conectando y estás intentando promocionar un nuevo directorio, surge la pregunta de por qué presentar este nuevo directorio si a la gente no le está gustando el sitio actual.
Y finalmente, si las personas comienzan a conectarse con ella.
Texto parafraseado: Vinculado: Google describe el proceso de elección de índices en una actualización fundamental.
Presupuesto y páginas web que son rastreadas e incluidas en un índice.
Para retomar parte de la conversación que tuvimos.
- Google tiene límites en su capacidad y no puede rastrear todos los contenidos de internet.
- Dado que Google no puede indexar todo el contenido disponible en la web, es esencial ser selectivo y priorizar la indexación del contenido relevante.
- Temas de contenido que suelen ser objeto de debate en la materia.
- Lugares significativos y de utilidad suelen ser objeto de debate y conexión.
Claramente, esta no es una enumeración exhaustiva de todos los factores que afectan a la indexación. Tampoco pretende ser una lista de control de SEO.
Es simplemente una sugerencia de los temas que son tan relevantes que fueron abordados por Gary Illyes y Martin Splitt.
Imagen principal proporcionada por Shutterstock/Trismegist san.
Reformulación del contenido del texto original.
Puedes escuchar el podcast en este enlace.