Red de conocimiento informático - Material del sitio web - ¿Cómo extraer rápidamente todos los enlaces URL de una página web?

¿Cómo extraer rápidamente todos los enlaces URL de una página web?

1. Para obtener enlaces de descarga en lotes, debe utilizar la función de guardar página del navegador. Aquí estoy usando el navegador Chrome. Después de abrir la página donde necesita descargar el enlace de datos, como se muestra en la siguiente figura, puede ver que se proporcionan dos enlaces de descarga después de cada pedido.

2. En este punto, haga clic derecho en la página y seleccione la opción Guardar como. Luego aparecerá una ventana que le permitirá guardar la ubicación de almacenamiento del archivo.

3. Aquí elijo el escritorio para guardar el archivo de esta página y luego le doy un nombre.

4. En este momento, puede ver en el escritorio que el nombre del archivo es solo un archivo html y un directorio. Todo lo que necesitamos es el archivo html.

5. En la plataforma Windows, sacamos la dirección y utilizamos el editor de texto Notepad. Haga clic derecho en el archivo html guardado y seleccione editar con el bloc de notas.

6. Después de abrirlo, despliegue y podrá ver todos los enlaces de descarga. Este es el formato del código fuente de html. desde estas fuentes. Seleccione la dirección en el código.

7. Presione el botón Ctrl F en la interfaz de edición para abrir la ventana de búsqueda, luego ingrese los caracteres ftp:// y luego elija buscar en el archivo.

8. Todas las direcciones de descarga que cumplan con las reglas aparecerán en la parte inferior de la página de edición, como se muestra en la siguiente figura.

9. Ahora use el mouse para seleccionar todas las direcciones de descarga, luego haga clic derecho y seleccione Copiar para copiar todas las direcciones de descarga.

10. Una vez completada la copia, cree un nuevo archivo url.txt en el escritorio y guarde la dirección que acaba de copiar.

11. Pegue todas las direcciones que acaba de copiar en el archivo txt. Puede ver que la dirección sigue siendo como se muestra en la imagen a continuación.

12. Primero, use el mouse para seleccionar el código previamente innecesario, como se muestra en azul en la siguiente figura. Luego haga clic en Editar encima del bloc de notas y haga clic en Reemplazar.

13. En la ventana de reemplazo, copie el código, péguelo en el contenido de búsqueda y luego haga clic en Reemplazar todo.

14. En este momento, encontrará que el código innecesario anterior ha desaparecido. De manera similar, copie el código innecesario posterior y reemplácelo con el mismo método, y finalmente obtenga todos los enlaces de descarga.

15. Como se muestra en la figura siguiente, no es necesario instalar ningún software de terceros complicado, solo se necesitan dos programas de bloc de notas.