Sabes que cuando realizas una búsqueda en Google, no estas buscando directamente sobre la web? Sino que lo estás haciendo sobre el índice de páginas web creado por Google.
Como hace Google para Indexar las Páginas Web?
Que es el Indice de Google?
El Índice de Google es la lista de todas las páginas web que Google ha analizado, indexado y además guardado en su memoria cache(acceso rápido).
Cuando alguien realiza una búsqueda, Google recupera por lo tanto todas las páginas web de su base de datos.
Mas de 40 mil millones de páginas web son indexadas por Google, esto equivale a sobre 100.000.000 GB. En comparación con Google, Bing solo indexa 14 mil millones. Lo que supone así apenas el 10% de las páginas web.
El 90% de las páginas web, que están ocultas para Google, se le llama «La Deep Web» o «Red Invisible». Por lo tanto son cerca de 450 mil millones de páginas web.
Google usa unos programas llamados «arañas» para indexar tu página web.
Tienen estas características:
- Fueron creados para navegar por la página como lo hace una persona.
- Además se mueven página a pagina, enlace a enlace.
- De esta manera encuentran e indexan cada página dentro de la web.
A este proceso se le llama Crawling!
Las Arañas de Google pueden indexar tu web con intervalos de tiempo que van desde:
- Varias veces al día.
- Hasta una vez cada 6 meses.
Todo depende de los cambios o actualizaciones que realices en el contenido de tu página web, así que crea contenido con regularidad y modifica además el que ya tienes.
Google necesita por lo tanto mas de 1.000.000 de servidores para que sus arañas analicen y devuelvan los resultados de búsqueda. En comparación, Facebook tiene solo 180.900, Intel 75.000 y eBay 54.000. Como hace google para indexar las páginas web?
Las Razones más comunes por las que Google no puede Indexar tu Página Web.
- No tener o que este mal configurado el fichero robots.txt.
- Una mala configuración del fichero .htaccess.
- Titulo mal escrito, como meta etiquetas, y autor.
- Incorrecta configuración de los parámetros de la URL.
- Además de un PageRank bajo.
- Fallos de conectividad de los servidores de DNS.
- Tener un historial del dominio con mala reputación.
Cómo Podemos Ayudar a Google a Indexar más Páginas Web?
4 Comentarios
Hola, ¿me podrían indicar la fuente consultada al indicar que «Mas de 40 billones de páginas web son indexadas por Google»?. Muchas gracias
- Autor
Hola Daniel, de aquí hemos sacado la cifra de páginas web indexadas por Google. Te sorprende el número por elevado o por bajo? 😉
Hola, Openinnova.
En efecto, me parecía muy alto. El problema es que han traducido «billions» (en inglés de los EEUU) por billones (en castellano). La traducción de «billions» (inglés de EEUU) es mil millones (a veces, dicho en algunos países de América Latina, millardos). Un billón en español (y en inglés Europeo) es un millón de millones. «One billion» (en inglés de los EEUU) es solo mil millones (o millardo).
La progresión en como sigue :
ESP/FRA/etc. – UK Eng USA Eng
1.000.000 Millón Million
1.000.000.000 Mil millones (o millardo) Billion
1.000.000.000.000 Billón Trillion
1.000.000.000.000.000 Mil billones Quadrillion
1.000.000.000.000.000.000 Trillón Quintillion
Mira el artículo de Wikipedia sobre la escala corta y la escala larga: http://es.wikipedia.org/wiki/Escalas_num%C3%A9ricas_larga_y_cortaSería bueno corregirlo porque este tipo de información se viraliza muy rapidamente y produce confusión
Atentamente
- Autor
Hola Daniel, genial aclaración! Es cierto que dependiendo de quien traduzca un texto del inglés nos podemos llevar algunas sorpresas. Corregido! Saludos… 😉