Red de conocimiento informático - Material del sitio web - Cómo cepillar las búsquedas relacionadas con Baidu

Cómo cepillar las búsquedas relacionadas con Baidu

Las siguientes son algunas breves introducciones y puntos de atención:

1. Acerca de la frecuencia de actualización de la búsqueda del sitio web

La búsqueda de Baidu puede establecer la frecuencia y el tiempo de actualización. En general, los sitios web grandes se actualizan con mucha frecuencia y se configuran rastreadores independientes para el seguimiento. Sin embargo, Baidu es más diligente y los sitios web pequeños y medianos generalmente se actualizan todos los días. Por lo tanto, si desea que su sitio web se actualice más rápido, es mejor tener su enlace en un directorio de categorías grandes (como Yahoosina NetEase), o en el sitio web relacionado de Baidu, tener un hipervínculo a su sitio web, o Su sitio web está en algunos sitios web grandes, como los blogs de sitios web grandes.

2. Acerca de la profundidad de la recopilación

La búsqueda de Baidu puede definir la profundidad de la recopilación, lo que significa que es posible que Baidu no busque todo el contenido de su sitio web, sino que solo indexe la página de inicio. del contenido de su sitio web, especialmente para sitios web pequeños.

3. Con respecto a la recopilación de sitios web que a menudo no están disponibles

Baidu tiene un criterio especial sobre el acceso a sitios web si descubre que un sitio web no está disponible, especialmente algunos pequeños y. En sitios web de tamaño mediano, Baidu deja automáticamente de enviar rastreadores a estos sitios web, por lo que es muy importante elegir un buen servidor y mantener el sitio web abierto las 24 horas del día.

4. Con respecto a los sitios web que cambian de IP

La búsqueda de Baidu puede basarse en el nombre de dominio o la dirección IP. Si es un nombre de dominio, se resolverá automáticamente en la dirección IP correspondiente. Entonces surgirán dos problemas. El primero es que si su sitio web usa la misma dirección IP que otros, si Baidu castiga el sitio web de otra persona, su sitio web estará implicado. El segundo es que si cambia la dirección IP, Baidu lo encontrará. que su nombre de dominio es diferente al anterior. Si la dirección IP no corresponde, también se negará a enviar rastreadores a su sitio web. Por lo tanto, se recomienda no cambiar la dirección IP a voluntad. Si es posible, intente utilizar la IP exclusivamente. Es importante mantener la estabilidad del sitio web.

5. Acerca de la recopilación de sitios web estáticos y dinámicos

A muchas personas les preocupa que páginas como asp?id= sean difíciles de recopilar y que páginas como html sean fáciles de recopilar. , la situación no es tan mala como cree. La mayoría de los motores de búsqueda actuales admiten la recopilación y recuperación de sitios web dinámicos, incluidos sitios web en los que es necesario iniciar sesión. Por lo tanto, no tiene que preocuparse de que su sitio web dinámico no esté disponible. Reconocido por el motor de búsqueda. El soporte dinámico de Baidu en la búsqueda se puede personalizar. Sin embargo, si es posible, intenta generar páginas estáticas. Al mismo tiempo, la mayoría de los motores de búsqueda todavía no tienen más remedio que lidiar con páginas que contienen caracteres ilegales en saltos de script (JS), marcos, hipervínculos Flash y páginas dinámicas.

6. Respecto a la desaparición del índice

Como se mencionó anteriormente, es necesario crear el índice de búsqueda. Generalmente, para una buena búsqueda, los índices son archivos de texto, no bases de datos. es necesario eliminar el índice. Un registro no es algo conveniente. Por ejemplo, Baidu necesita utilizar herramientas especiales para eliminar manualmente un registro de índice. Según los empleados de Baidu, Baidu tiene un grupo de personas responsables de este asunto: recibir quejas, eliminar registros y manualmente. Por supuesto, también puede eliminar directamente todos los índices bajo una determinada regla, es decir, puede eliminar todos los índices bajo un determinado sitio web. También existe un mecanismo (no verificado), es decir, las páginas web caducadas y las páginas web engañosas (principalmente títulos de páginas web, palabras clave y contenido que no coinciden) también se eliminarán durante el proceso de reconstrucción del índice.

7. Acerca de la deduplicación