¿Puedo leer novelas gratis mientras aprendo programación?
Sí. Primero, abrimos un sitio web de novelas, buscamos la novela que necesitamos rastrear y hacemos clic en el enlace para ingresar a la página del directorio de capítulos. Pulsamos F12 para entrar en las herramientas de desarrollador.
En este momento veremos una dirección de 1796979.html, pero esta dirección obviamente no está disponible. Cuando nuestro cursor permanezca sobre ella, veremos una dirección detallada. Encontrará que las direcciones URL. Los detalles de nuestros capítulos son regulares.
¡Descubriremos que al concatenar estas dos cadenas se obtiene la URL que necesitamos!
Bien, la siguiente es nuestra etapa de código. ¡Crea un nuevo proyecto de Python y llámalo getNovelContent!
Primero necesitamos obtener el código fuente del capítulo de la tabla de contenidos.
A continuación, necesitamos obtener nuestro capítulo de tabla de contenido.
Este es el código fuente para que podamos obtener el capítulo de tabla de contenido. A continuación, debemos recorrer las URL y mostrar el contenido. datos almacenados en él. Primero necesitamos obtener los capítulos y unir el código fuente de la URL.
Entonces necesitamos obtener el contenido de nuestro capítulo. Al obtener el contenido de nuestro capítulo, debemos recordar mirar el formato de codificación del contenido y decodificarlo. A continuación escapamos el html obtenido. Usamos xpath para obtener el contenido novedoso. XPath se puede copiar directamente en las herramientas de desarrollador y luego usamos un bucle for para reemplazar /xa0.
¡El último paso es descargar nuestra novela! código fuente.