Cómo corregir los errores de rastreo de las Herramientas para webmasters de Google
Puede ayudarle a comprobar si hay enlaces incorrectos, no sólo enlaces URL, sino también fallos en la resolución de DNS, enlaces de servidores, archivos robots.txt, etc. Se producirán errores de rastreo en casi todos los sitios web. Webmaster Tools divide los errores en dos categorías: errores del sitio y errores de URL. Si hay varios errores de rastreo en un sitio web, la confianza de su sitio web disminuirá e incluso afectará la clasificación. Por supuesto, esta herramienta también es eficaz para la optimización de Baidu. Así debería ser. A través de la clasificación de errores del rastreo del robot de Google, puede saber qué causa el error de rastreo. 1. Errores HTTP Cuando una página web en un sitio web (por ejemplo, cuando un usuario visita su página web en un navegador o el robot de Google rastrea la página) realiza una solicitud a su servidor, el servidor devuelve un código de estado HTTP en respuesta a la solicitud. . Si aparece un estado 403, puedes ignorarlo. Esto indica que tu host está bloqueando el rastreo del robot de Google. Para obtener una lista de todos los códigos de estado HTTP, consulte la página de ayuda de códigos de estado HTTP de Google. 2. Errores en el mapa del sitio Los errores del mapa del sitio a menudo causan una página de error 404, o devuelven una página de error 404 en el mapa actual. Si aparece una página de error 404, verifique todos los enlaces en el mapa del sitio. Google continuará rastreando su mapa del sitio eliminado. Esto es frustrante, pero hay una solución: asegúrese de que el mapa del sitio anterior se haya eliminado en las herramientas del administrador. Si no desea que lo rastreen, asegúrese de que el mapa del sitio anterior muestre 404 o redirija al nuevo mapa del sitio. Susan Moskwa, empleada de Google, explicó: La mejor manera de evitar que el robot de Google rastree es hacer que estas URL (como los mapas de sitios antiguos) aparezcan 404. Cuando vemos que una URL aparece 404 varias veces, el robot de Google dejará de rastrear. 3. Errores de redireccionamiento Algunos errores son causados por redirecciones 301. A qué debe prestar atención después de ejecutar redirecciones: 1: Asegúrese de que devuelvan el código de estado HTTP correcto. 2: Asegúrate de que no haya redireccionamientos circulares. 3: Asegúrese de que la redirección apunte a una página web válida, no a una página 404 u otra página de error, como 503 (Error del servidor) o 403 (Buscar prohibido). 4: Asegúrese de que la redirección no apunte a una página vacía. 4. Error 404 El error 404 puede aparecer en los siguientes aspectos: 1: Eliminar una página web en el sitio web; 2: Cambiar el nombre de la página web; 4: Vincular a una página inexistente; sitio web Página anterior que no existe; 6: El sitio web se migra a un nuevo nombre de dominio que no coincide exactamente con el sitio web. 5. Otra razón para estar restringido por robots.txt es que el archivo robots.txt impide que Googlebot rastree. Si se produce una gran cantidad de errores de rastreo, el primer paso debe ser verificar el archivo robots.txt. 6. Error 404 suave Normalmente, cuando alguien solicita La página no existe y el servidor devolverá un error 404 (no encontrado). Además de devolver un código 404 en respuesta a que la página solicitada no existe, el servidor también mostrará una página 404. Este podría ser un mensaje estándar de "archivo no encontrado" o podría ser una página personalizada diseñada para proporcionar al usuario más información. El contenido de la página es completamente irrelevante para la respuesta HTTP devuelta por el servidor. El hecho de que una página muestre un mensaje 404 Archivo no encontrado no significa que sea una página 404. 7. Tiempo de espera El tiempo de espera del sitio web también es una de las razones de los errores de rastreo. Si se agota el tiempo de espera, el robot de Google dejará de rastrear. Los tipos de errores de tiempo de espera son: 1: Tiempo de espera de DNS. Puede utilizar el comando Nslookup para detectar DNS. El factor más importante en el tiempo de espera de DNS es que el servidor DNS del proveedor de servicios de nombres de dominio es inestable. 2: tiempo de espera de la URL, error en una página específica, no en todo el dominio. 3: Robots.txt agota el tiempo de espera. Si su sitio web tiene robots.txt pero el servidor agota el tiempo de espera, Googlebot asumirá que el archivo no existe.