Cómo descargar la lista de los más vendidos de Dangdang
Antes de extraer datos, necesitamos instalar la biblioteca Selenium para Python y el navegador Chrome, y configurar ChromeDriver.
Selenium es una herramienta de prueba automatizada que se puede utilizar para hacer que el navegador realice operaciones específicas, como hacer clic, desplazarse hacia abajo, etc., y también se puede utilizar para obtener el código fuente de la página actual. renderizado por el navegador. Puede obtener el código fuente de la página que actualmente representa el navegador y hacerlo visible para el scraping. Este método de raspado funciona muy bien para algunas páginas que JavaScript representa dinámicamente.
Para acceder a la página de best sellers de Dangdang, necesitamos usar Selenium para capturar la información del libro y usar pyquery para analizarla y obtener la clasificación, la imagen, el nombre, el precio, las reseñas y otra información del libro.