¿Qué es rastrear una URL?

Si quieres que tu página web aparezca entre los primeros resultados de las páginas de búsqueda, debes saber qué es rastrear una URL con Google y cuál es la mejor vía para hacerlo. De esa forma, garantizarás que el buscador indexe de manera correcta todo el contenido de tu sitio web.

¿Qué es rastrear una URL?

Para entender qué significa rastrear una URL, debes tener claro qué son las arañas o rastreadores web.

Las arañas, también llamadas rastreadores, son programas que viajan por la red en busca de contenido nuevo. Algo así como cazadores de páginas web. Cuando encuentran una que no figuraba en el índice, navegan a través de ella, siguiendo enlaces, activando scripts y recabando información. Luego, envían el resultado de su indagación al buscador, para que este pueda indexar el nuevo contenido.

Este proceso es al que llamamos rastrear una URL. Y no es propio de Google, pues todos los buscadores lanzan sus rastreadores en busca de “actualizaciones” en la Red.

¿Qué es rastrear una URL?

¿Cómo rastrear una página web?

Se recomiendan 3 métodos para rastrear con Google tu sitio web, y deberás utilizarlos todos a la vez si quieres resultados óptimos.

1. Meta canonical

Es un potente recurso para ayudar a Google a rastrear tus páginas web. Se le llama meta canonical al atributo HTML que le indica al buscador indexar solo una URL en concreto.

Por ejemplo, supongamos que tu sitio es accesible a través de varias URLs:

www.tusitio.com tusitio.com www.tusitio.com/index.php tusitio.com/index.php

Como ves, se trata del mismo sitio pero referenciado de manera distinta cada vez. El buscador puede suponer que hay contenido duplicado, pues ha detectado varias URL que conducen al mismo contenido. Para evitar esto, añades a URL preferente en la cabecera entre el <head> y </head> del HTML tu página:

<link rel=’canonical’ href=’tusitio.com’/>

Atributos hreflang

El atributo hreflang se incluye en la etiqueta <link> para indicar en qué idioma está el contenido de la página. Eso, por supuesto, si tienes versiones de tu sitio para cada idioma. Por ejemplo:

<link rel=’alternate’ hreflang=’es’ href=’http://www.tusitio.es’>

Nota que la URL no tiene que ser cómo la indicamos arriba. También podrías poner: es.tusitio.com y www.tusitio.com/es, entre otras variantes.

Directivas robot

Las directivas robot le dicen a Google cómo debe indexar las páginas de tu web sin estorbarles la navegación a los usuarios. Ell permite, entre otras cosas:

evitar problemas de contenido duplicado

 

 

no indexar partes del sitio que prefieres
ocultar

Para ello, simplemente tienes que incluir la meta etiqueta <robots> en el código de la página cuyo rastreo quieres controlar:

<meta name="robots" content="directiva1, directiva2, ..." />

El valor de contents pueden ser las siguientes directivas:

noindex: evita que Google indexe el
sitio web (su opuesta es index
y no hay que indicarla, pues el buscador la asume por defecto)

 

 

nofollow: impide a los rastreadores
seguir el enlace (su opuesta es follow,
y trabaja igual que index)

 

 

notranslate: le dice al buscador que
no ofrezca traducciones de la página

 

 

noarchive: no se muestra la página
disponible la caché de Google

 

 

nosnippet: no mostrar la información
de los fragmentos enriquecidos (snippets) en los resultados de
búsqueda

 

 

unavailable_after: pasado un tiempo la página no aparecerá más en los resultados de búsqueda

¿Cómo volver a rastrear una URL?

Los cambios anteriores tardarán en hacer efecto, puesto que las arañas demoran un tiempo en volver. Es entonces cuando te preguntas cómo volver a rastrear una URL de inmediato. Para conseguirlo, debes entrar en Search Console y solicitarle a Google que rastree de nuevo la URL modificada.

Una forma de hacerlo es usar la herramienta de inspección de URL’s y dar clic en el Solicitar información. Otra vía es enviar un sitemap ya sea lanzando una solicitud GET con la herramienta de hacer pings, o insertando en el archivo robots.txt una linea como la siguiente:

Sitemap: http://misitio.com/sitemap.xml

De esa manera, Google tendrá en cuenta las nuevas directivas de rastreo con efecto inmediato.

Si este artículo te ha sido de utilidad, valora con 5 estrellas

© IDX Engine by Innovadeluxe Diseño y Desarrollo Web, S.L. Todos los derechos reservados