Cómo utilizar el sistema de recopilación de información de medición del viento
1. Configuración del sitio web:
1 Crear un sitio:
Seleccione "Configuración del sitio web" para ingresar la configuración de la colección. sitio web.
Primero seleccione "Nuevo sitio":
Nombramos el sitio "Noticias de entretenimiento" y la columna de destino de almacenamiento se puede seleccionar según sea necesario. Lo configuré en Test_1 y completé la dirección del sitio web favorito como la dirección de la página favorita:/entertainment.shtml. Por supuesto, la plantilla la elegí yo. Aquí, debido a que la página del objeto de la colección puede tener imágenes, la configuré para guardar imágenes remotas. Si no necesita recopilar imágenes de la página del objeto, puede dejarla sin marcar. Luego guárdelo y podrá ver el sitio que acabamos de crear en la configuración del sitio en segundo plano.
A continuación, debemos modificar el asistente.
2. Asistente de modificación:
Haga clic en el Asistente de modificación y aparecerá la siguiente interfaz:
Estos son los parámetros del sitio web que acabamos de crear. Haga clic en "Siguiente" directamente para ingresar las condiciones para configurar la lista de noticias:
En este punto, abrimos el sitio y verificamos el archivo fuente de la página del objeto de la colección. Lo mejor es copiar el archivo fuente a DW (Dreamweaver) para que podamos encontrar las condiciones adecuadas.
Ver el código fuente de la lista de noticias en DW:
La parte sombreada en la imagen a continuación es el código de la lista:
De la imagen podemos ver que el código es:
Entonces veamos dónde termina el código del listado.
Los códigos de lista de esta página terminan con los siguientes caracteres:
De esta forma hemos encontrado el código de inicio y el código de fin de la lista. En estos dos códigos, necesitamos obtener directamente la lista de noticias, por lo que las condiciones que establecemos son las siguientes:
Aquí no hay paginación establecida, simplemente haga clic en Siguiente para ingresar la configuración de condición del enlace de noticias:
En este momento puede ver que la página está dividida en tres partes: parte de configuración de condición de lista de URL, parte de código y parte de resultado. Si el paso anterior se configura correctamente, la parte del código y la parte del resultado aquí mostrarán el código y la lista de noticias de la lista de noticias obtenida.
Aquí comenzamos a configurar el código para obtener el enlace:
La parte sombreada es el código de una noticia, por lo que podemos ver que el código de ruta del enlace de esta noticia es :
& lta href =/news/2005/2005-11-01/8/645660 shtml TARGET = _ en blanco >, podemos reemplazar directamente la ruta "/news/2005/2005-11. -01/8 /645660. shtml "Con nuestros parámetros [listar URL], las condiciones de adquisición establecidas son las siguientes:
Después de configurar este paso, haga clic en Siguiente para configurar las condiciones para leer la página de noticias.
En este paso podrás ver una vista previa de los resultados. Si las condiciones establecidas son correctas, haga clic en el enlace para abrir la página de la primera noticia de la lista.
Aquí se utiliza principalmente para configurar el título y el contenido de la noticia. Los principios prácticos con respecto a otras configuraciones de autor son los mismos.
Lo primero es abrir la página de noticias, comprobar el archivo fuente y buscar el código correspondiente en DW.
"Configuración de título" El título de la página del sitio web es el título de la noticia, como se muestra en la figura:
, luego podemos establecer la condición en:
Las condiciones también se pueden establecer como:
& lttable width = " 95% " border = " 0 " cellpacing = " 0 " cell padding = " 0 " align = " center " class = 20v height = " 56 " >[Título]
Configuración de contenido busca el código donde se encuentra el contenido. Si hay una imagen delante del contenido de las noticias en este momento, tenga en cuenta que la imagen está incluida en el contenido. No borres la imagen. No se requieren fotografías.
Usando el mismo principio que antes, podemos encontrar el comienzo del contenido:
& lttable width = " 85% " border = " 0 " cellpacing = " 0 " cell padding = " 0 " align = " center " class = 14-1v & gt; Cabe señalar que el final aquí no es necesariamente
& lttable width = " 95% " border = " 0 " cellpacing = " 0 " cell padding = " 0 " alinear = "centro" altura = "43">.
Por lo tanto, establecemos las condiciones para recopilar títulos y contenido de la siguiente manera:
Aquí, usted mismo puede configurar manualmente la fuente de noticias:
Luego haga clic en Siguiente para ver El efecto colección.
Si no hay título ni contenido, puede que haya algún problema con las condiciones de recogida. Configúrelo más tarde. La recopilación frecuente puede requerir múltiples depuraciones.
2. Filtrado de palabras clave:
Como se puede ver en el último paso de nuestra configuración, las noticias recopiladas contienen anuncios y debemos filtrar los anuncios. Seleccione el nuevo filtro y establezca las condiciones que necesitamos:
Elija usted mismo el nombre de la regla y elija el nombre correcto al aplicar al sitio. La clave es establecer las condiciones para filtrar cadenas. Miramos el archivo fuente para encontrar el código donde se encuentra el anuncio. Tenga en cuenta que el código de publicidad se reemplaza por nuestra [Cadena de filtro]. Nuestro filtrado de publicidad aquí se puede configurar en:
Tres. Colecciones
En la configuración del sitio web, puede ver los sitios web de colecciones que hemos configurado. Siempre que establezcas las condiciones, puedes recopilarlas directamente:
Haz clic en el botón de recopilación correspondiente a "Noticias de entretenimiento" y aparecerá un cuadro de diálogo:
Si quieres recopile toda la página de noticias, no es necesario establecer la cantidad de recopilación; de lo contrario, deberá establecer la cantidad de artículos que se recopilarán, pero tenga cuidado de que el número establecido no pueda exceder la cantidad de noticias en esta página, de lo contrario se producirá un error. ocurrirá.
Por comodidad, sólo colecciono 5 piezas. Cuando empiezo a recopilar, puedo ver el mensaje:
Una vez completada la recopilación, puede ver:
Si la recopilación no tiene éxito, le preguntará si el título o el contenido son correctos. equivocado.
Cuatro. Almacén
Después de la recopilación, haga clic en Auditar datos para ver los datos que acaba de recopilar:
Puede elegir almacenar algunos mensajes o todos los mensajes en la biblioteca. Después de ingresar a la base de datos, el archivo no se puede ver durante la revisión, pero aún se puede ver en los datos históricos. Aquí puede hacer clic en "Editar" para ver si sus anuncios han sido filtrados. Si todavía hay anuncios aquí, regrese y restablezca las condiciones del filtro.
Auditoría de verbo (abreviatura de verbo)
Si se selecciona "Las noticias han sido aprobadas" al configurar la ubicación de pago, no se requiere aprobación después de que las noticias se almacenen en la base de datos; de lo contrario, Se requiere aprobación.
Después de revisar el artículo, podemos generar directamente una vista previa.
Incluso si nuestra colección está completa, la configuración de la colección requiere principalmente una cierta comprensión del código html. Al configurarla, debemos prestar atención a la singularidad de las condiciones.