Destacados SEO

¡A navegar grumetes!: Rastreo e indexación, primer contacto con Google

¿Qué es indexar y cómo indexa mi página Google?

Google en muchos sentidos se comporta como los antiguos piratas y exploradores: Un rumor lo despierta, una vela arriada al viento lo empuja y la línea de costa lo guía.

Su afán por descubrir nuevas tierras y tesoros impulsa sus veleros bergantines, mientras sus robóticos marineros gobiernan la nave  rastreando el horizonte desde el palo mayor.

Google es hoy el mayor explorador de nuestro tiempo, y cada site nuevo que ve lo indexa para ser incluido en su inmenso mapa de búsqueda.

¿Y cómo lo hace? ¡En Loopeando.com nos embarcamos en la metáfora con el propósito de contártelo de la manera más clara y original posible!

 

Rastreo: Acabo de crear una web, ¿cómo hago para que Google se entere y me incluya en sus resultados?

Cuando subes por vez primera tu nueva y flamante página web a internet, tras comprobar que está online y que todo funciona correctamente, la siguiente duda suele ser: ¿Y ahora cómo hago para aparecer en Google?

Respuesta corta: Nada, esperar. Simplemente promociona tu web entre amigos, redes sociales y webs del sector.

Respuesta larga: Google emplea un software de rastreo, llamado Googlebot, cuya principal misión es explorar la red en busca de páginas webs nuevas y de cambios en las páginas que ya se encuentran en su directorio.

Cuando una web ya está descubierta, su software envía con cierta periodicidad a sus exploradores para ver si hay novedades y, en caso de haberlas, añadirlas a su índice.

Ahora bien, ¿y si mi web no ha sido descubierta? Tarde o temprano alguien (o tú mismo), hablará sobre ella en algún lugar del que el buscador sí tenga conocimiento (un foro, una red social, otra página…) y, cuando eso ocurra, sus bots se lanzarán a la búsqueda de ese rumor hasta conseguir hallarte.

TIP DE LOOPEANDO:

Existen atajos para agilizar este proceso tales como hacer ping a tu web o a tu entrada nueva (si lo que queremos es que detecte que has actualizado), utilizar el formulario de Google para indicarle que añada una url o, el más recomendable de todos, utilizar Google Seach Console.

Si quieres aprender a utilizar esta potente herramienta de Google, te recomendamos leer: “¿Cómo concertar una cita con los bots de Google?”.

 

¿Y cómo es capaz de encontrar una página web nueva o las novedades de mi blog cuando lo actualizo?

El tipo de software que Google utiliza para explorar, pertenece a un tipo de programas muy peculiar: Los llamados crawlers o spiders.

La programación que llevan dentro les permite funcionar de manera autónoma, extrayendo de una web todos los enlaces que contiene para acceder a ellos posteriormente. De esa forma, en cuanto una página actualiza con algún artículo nuevo o alguien cita una web que Google desconocía, Googlebot es capaz de entrar a esa url como si fuésemos nosotros navegando por la red.

Eso implica que Google sólo podrá rastrear las webs que sean de dominio público. Todas aquellas que tengan vetado el acceso de este tipo de programas a través de enlaces nofollow o de robots.txt, serán inaccesibles para el buscador.

TIP DE LOOPEANDO:

Al ser tú el primer interesado en que los buscadores encuentren hasta la última página pública de tu site, puedes echarles una mano creando un índice de enlaces. Éste puede incluso generarse de manera automática, así cada vez que redactes una nueva entrada se añadirá al índice y se comunicará a los buscadores.

Si quieres aprender a hacerlo, te recomendamos leer “Crear un sitemap.xml

 

Indexación: Descubierta tu web, ahora toca mapearla para entenderla a fondo

Tal y como decíamos, los crawlers son capaces de detectar las urls de una página y seguirlas. Pero también son capaces de “parsearla” es decir, de extraer del código HTML la información que les interese.

Para ello es importantísimo que nuestra web cumpla los estándares del W3C y sea SEO friendly. De esa manera, Google será capaz de entender qué parte del código corresponde al cuerpo de una noticia, qué parte pertenece al título, cuál a imágenes, dónde está el nombre del autor, la fecha de publicación, etc

 

TIP DE LOOPEANDO:

Si quieres aprender las buenas prácticas para que tu web sea totalmente transparente a los buscadores, no dejes de leer nuestra guía “El artículo perfecto en 16 pasos”, y centrarte muy especialmente en los pasos del 9 al 16. Pero también será interesante que, como ya hemos comentado, utilices la herramienta Google Seach Console y los “fragmentos enriquecidos” que allí se te indican.

 

Entendida tu web, al Gran Buscador ya sólo le quedará indexar toda esa información o lo que es lo mismo, añadirla a su índice de manera que sepa exactamente lo que contiene tu web. Así podrá mostrarla cuando alguien le pregunte por un contenido sobre el que tú has escrito.

El por qué aparecerás en 1ra, 10ª o 30ª posición para una búsqueda determinada, es algo que dependerá de los más de 200 factores que maneja su algoritmo y eso, querido lector, es el gran tema transversal que vertebra casi todo el saber de este site. Por lo tanto, no tengas prisa, lee mucho, aprende más y practica constantemente ya que así, algún día, será tu web la que corone la lista de resultados.

 

Si te ha gustado este artículo, ¡¡no dudes en compartirlo!!

Cristian Sarabia Martínez

Desde que a principios de los 90 mi padre desempolvó su Spectrum, no he dejado de probar y experimentar con la tecnología.

Enamorado del mundo web, Full Stack Developer de profesión y diseñador por devoción.

Ahora hago mis pinitos en esto del blogging para compartir con vosotros un poquito de todo lo que la comunidad me ha dado.

Escribir comentario

Haz clic aquí para dejar tu comentario