¿Por qué Google rastrea las páginas web siempre en una fecha fija?
Es necesario conocer el mecanismo de gestión actual de los motores de búsqueda:
Cada día nacen miles de sitios web en Internet, y no importa qué motor de búsqueda buscará en Internet a través de varios canales. Tras analizar el tráfico, sólo algunas de ellas que alcancen el volumen de tráfico, o aquellas que ella crea que tienen un determinado valor, serán catalogadas como objetos de conexión, pero aun así la ampliación del número de páginas web es considerable.
Por lo tanto, para ahorrar recursos, los motores de búsqueda guardarán una instantánea de la página web cuando descubran y determinen que el sitio web está conectado, y no se preocuparán por ello en el futuro, y solo lo comprobarán. en un momento fijo en un determinado mes. Credibilidad de la conexión, si la conexión no es válida, la conexión se elimina. Sin embargo, esta operación rara vez se realiza, por lo que a veces no se puede ver el contenido de la página web conectada o no se puede mostrar la imagen buscada cuando se amplía.
En el servidor del motor de búsqueda, habrá un grupo de subprocesos, y los subprocesos en el grupo de subprocesos son específicamente responsables de este asunto. El número actual de páginas web es demasiado grande, considerando que el número puede expandirse. aún más en el futuro, por lo que guardar esta información de conexión se convierte en un problema. Si una sola conexión guarda la fecha y hora interceptadas, la base de datos será demasiado grande y, en realidad, no es necesario que la fecha y hora de todas las páginas web interceptadas sean demasiado. preciso. Por lo tanto, la información horaria de las páginas web interceptadas en momentos similares se resumirá en una sola vez, lo que reduce en gran medida la cantidad de almacenamiento de información.
Si buscas en Baidu, verás que en realidad hay problemas similares, pero no son tan obvios como en Google, porque debes saber que Google almacena información sobre sitios web de todo el mundo, mientras que Baidu se dirige principalmente sólo a sitios web chinos