SEO: ¿Cómo determinan las arañas las actualizaciones de un sitio web?
1. Código de estado http de la página 304 Cuando la araña solicita acceder a una página por segunda vez, si la página no se ha actualizado, se enviará un código 304. y el motor de búsqueda también utilizará el código de estado http 304 para determinar si la página se ha actualizado.
2. Hora de la última modificación del archivo modificado Este es un atributo en la información del encabezado http. Registra principalmente la hora en que se modificó la página por última vez. Muchas veces lo encontraremos aunque algunos sitios web tengan pesos elevados. El contenido de la página no se actualiza a tiempo, pero la instantánea aún se puede actualizar todos los días, que es la función de Última modificación. Sin embargo, cabe señalar que Última modificación solo existe en páginas estáticas de forma predeterminada y, por lo general, no se devuelve para páginas secundarias. Por lo tanto, Última modificación es solo un valor de referencia para que las arañas determinen si la página se ha actualizado, no un valor. condición.
3. Comparar tamaños de archivos. Los motores de búsqueda también tomarán los archivos de la página anterior y los compararán con los archivos actuales. Sin embargo, dado que la mayoría de los sitios web se reemplazan y actualizan, a menudo es difícil explicar el problema. Comparar tamaños de archivos. Se usa comúnmente con cambios de enlaces de páginas.