Red de conocimiento informático - Material del sitio web - Cómo descargar la lista de los más vendidos de Dangdang

Cómo descargar la lista de los más vendidos de Dangdang

Puede utilizar Selenium para rastrear las clasificaciones de los más vendidos de Dangdang.com.

Antes de extraer datos, necesitamos instalar la biblioteca Selenium para Python y el navegador Chrome, y configurar ChromeDriver.

Selenium es una herramienta de prueba automatizada que se puede utilizar para hacer que el navegador realice operaciones específicas, como hacer clic, desplazarse hacia abajo, etc., y también se puede utilizar para obtener el código fuente de la página actual. renderizado por el navegador. Puede obtener el código fuente de la página que actualmente representa el navegador y hacerlo visible para el scraping. Este método de raspado funciona muy bien para algunas páginas que JavaScript representa dinámicamente.

Para acceder a la página de best sellers de Dangdang, necesitamos usar Selenium para capturar la información del libro y usar pyquery para analizarla y obtener la clasificación, la imagen, el nombre, el precio, las reseñas y otra información del libro.