Cómo resolver los errores de rastreo de las Herramientas para webmasters de Google
Puedes ver qué causa los errores de rastreo clasificándolos por el robot de Google.
1. Errores HTTP
Cuando una página web de un sitio web (por ejemplo, cuando un usuario visita su página web en un navegador o cuando el robot de Google rastrea la página) se envía a su solicitud del servidor, el servidor devuelve un código de estado HTTP en respuesta a la solicitud.
Si aparece un estado 403, puedes ignorarlo. Esto indica que tu host está bloqueando el rastreo del robot de Google. Para obtener una lista de todos los códigos de estado HTTP, consulte la página de ayuda de códigos de estado HTTP de Google.
Errores en el mapa del sitio
Los errores del mapa del sitio a menudo causan páginas de error 404 o devuelven una página de error 404 en el mapa actual. Si aparece una página de error 404, verifique todos los enlaces en el mapa del sitio.
Google continuará rastreando su Sitemap eliminado, lo cual es muy frustrante, pero hay una manera de solucionarlo: asegúrese de que el Sitemap antiguo se haya eliminado en las herramientas de administrador. Si no desea que lo rastreen, asegúrese de que el mapa del sitio anterior muestre 404 o redirija al nuevo mapa del sitio.
De la empleada de Google, Susan Moskwa, explica:
La mejor manera de detener el rastreo del robot de Google es hacer que estas URL (como mapas de sitios antiguos) aparezcan 404 cuando vemos una URL después de varios 404. , el robot de Google dejará de rastrear.
Errores de redireccionamiento
Algunos errores son causados por redirecciones 301. A qué prestar atención después de realizar redirecciones:
Asegúrese de que regresen al código de estado HTTP correcto. .
Asegúrate de que no haya bucles de redireccionamiento.
Asegúrese de que la redirección apunte a una página web válida y no a una página 404 u otra página de error, como 503 (Error del servidor) o 403 (Fetch Forbidden).
Hacer Asegúrese de que la redirección no apunte a una página web válida. Una página vacía.
Error 404
El error 404 puede aparecer en los siguientes aspectos:
1: Páginas web eliminadas del sitio web;
2: Cambió el nombre de la página web;
3: Vinculado a una página inexistente;
4: Otros sitios web vinculados a una página inexistente en su sitio web;
5: El sitio web se migra a un nuevo sitio web cuyo nombre de dominio no coincide exactamente.
Restringido por robots.txt
Otra razón es que el archivo robots.txt impide que Googlebot rastree. Si se produce una gran cantidad de errores de rastreo, el primer paso debe ser verificar los robots. .txt
Error 404 suave
Normalmente, cuando alguien solicita una página que no existe, el servidor devolverá un error 404 (no encontrado). Además de devolver un código 404 en respuesta a que la página solicitada no existe, el servidor también mostrará una página 404. Este podría ser un mensaje estándar de "archivo no encontrado" o podría ser una página personalizada diseñada para proporcionar al usuario más información. El contenido de la página es completamente irrelevante para la respuesta HTTP devuelta por el servidor. El hecho de que una página muestre un mensaje 404 Archivo no encontrado no significa que sea una página 404.
Tiempo de espera
El tiempo de espera del sitio web también es una de las razones de los errores de rastreo. Si se agota el tiempo de espera, el robot de Google dejará de rastrear. Los tipos de errores de tiempo de espera son:
1: Tiempo de espera de DNS, puede usar el comando Nslookup para detectar DNS. El factor más importante en el tiempo de espera de DNS es que el servidor DNS del proveedor de servicios de nombres de dominio es inestable.
2: Tiempo de espera de URL, error en una página específica, no en todo el dominio.
3: El tiempo de espera del archivo robots.txt se agota. Si su sitio web tiene robots.txt pero el tiempo de espera del servidor se agota, el robot de Google asumirá que el archivo no existe.
4: El tiempo de respuesta de las páginas web dinámicas es demasiado largo, lo que provoca que la página web tarde demasiado en cargarse.