Contacto: 881 94 19 61 - info@openinnova.es

Como hace Google para Indexar las Páginas Web ?

Como hace Google para Indexar las Páginas Web ?
Google es el buscador web más utilizado, fue creado en 1998 y tiene la mayor base de datos de páginas web indexadas del mundo… tiene 2 veces más que Yahoo y Bing(Microsoft). Quieres saber cómo hace google para indexar las páginas web?

Sabes que cuando realizas una búsqueda en Google, no estas buscando directamente sobre la web? Sino que lo estás haciendo sobre el índice de páginas web creado por Google.

Como hace Google para Indexar las Páginas Web?

Que es el Indice de Google?

El Índice de Google es la lista de todas las páginas web que Google ha analizado, indexado y además guardado en su memoria cache(acceso rápido).

Cuando alguien realiza una búsqueda, Google recupera por lo tanto todas las páginas web de su base de datos.

Mas de 40 mil millones de páginas web son indexadas por Google, esto equivale a sobre 100.000.000 GB. En comparación con Google, Bing solo indexa 14 mil millones. Lo que supone así apenas el 10% de las páginas web.

El 90% de las páginas web, que están ocultas para Google, se le llama «La Deep Web» o «Red Invisible». Por lo tanto son cerca de 450 mil millones de páginas web.

Google usa unos programas llamados «arañas» para indexar tu página web.

Tienen estas características:

  • Fueron creados para navegar por la página como lo hace una persona.
  • Además se mueven página a pagina, enlace a enlace.
  • De esta manera encuentran e indexan cada página dentro de la web.

A este proceso se le llama Crawling!

Las Arañas de Google pueden indexar tu web con intervalos de tiempo que van desde:

  • Varias veces al día.
  • Hasta una vez cada 6 meses.

Todo depende de los cambios o actualizaciones que realices en el contenido de tu página web, así que crea contenido con regularidad y modifica además el que ya tienes.

Google necesita por lo tanto mas de 1.000.000 de servidores para que sus arañas analicen y devuelvan los resultados de búsqueda. En comparación, Facebook tiene solo 180.900, Intel 75.000 y eBay 54.000. Como hace google para indexar las páginas web?

Las Razones más comunes por las que Google no puede Indexar tu Página Web.

  1. No tener o que este mal configurado el fichero robots.txt.
  2. Una mala configuración del fichero .htaccess.
  3. Titulo mal escrito, como meta etiquetas, y autor.
  4. Incorrecta configuración de los parámetros de la URL.
  5. Además de un PageRank bajo.
  6. Fallos de conectividad de los servidores de DNS.
  7. Tener un historial del dominio con mala reputación.

Cómo Podemos Ayudar a Google a Indexar más Páginas Web?

1. Comprueba los errores que devuelve la araña de Google desde la página de Webmaster Tools.
2. Se además cuidadoso con las aplicaciones que utilicen AJAX para mostrar contenido.
3. Añade el fichero robots.txt y asegúrate también de que funciona correctamente.
4. Crea y añade el sitemap de tu página web.
Soluciones Software Libre para Empresas. Nuestro Trabajo. Tu Éxito. Somos Artesanos del Software.

4 Comentarios

  1. Daniel Prado 9 años hace

    Hola, ¿me podrían indicar la fuente consultada al indicar que «Mas de 40 billones de páginas web son indexadas por Google»?. Muchas gracias

    • Autor
      Openinnova 9 años hace

      Hola Daniel, de aquí hemos sacado la cifra de páginas web indexadas por Google. Te sorprende el número por elevado o por bajo? 😉

      • Daniel Prado 9 años hace

        Hola, Openinnova.
        En efecto, me parecía muy alto. El problema es que han traducido «billions» (en inglés de los EEUU) por billones (en castellano). La traducción de «billions» (inglés de EEUU) es mil millones (a veces, dicho en algunos países de América Latina, millardos). Un billón en español (y en inglés Europeo) es un millón de millones. «One billion» (en inglés de los EEUU) es solo mil millones (o millardo).
        La progresión en como sigue :
        ESP/FRA/etc. – UK Eng USA Eng
        1.000.000 Millón Million
        1.000.000.000 Mil millones (o millardo) Billion
        1.000.000.000.000 Billón Trillion
        1.000.000.000.000.000 Mil billones Quadrillion
        1.000.000.000.000.000.000 Trillón Quintillion
        Mira el artículo de Wikipedia sobre la escala corta y la escala larga: http://es.wikipedia.org/wiki/Escalas_num%C3%A9ricas_larga_y_corta

        Sería bueno corregirlo porque este tipo de información se viraliza muy rapidamente y produce confusión

        Atentamente

        • Autor
          Openinnova 9 años hace

          Hola Daniel, genial aclaración! Es cierto que dependiendo de quien traduzca un texto del inglés nos podemos llevar algunas sorpresas. Corregido! Saludos… 😉

Dejar una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*