Cómo estar en la lista de los más vendidos en Dangdang.com
Antes de rastrear datos, necesitamos instalar la biblioteca Python Selenium y el navegador Chrome, y configurar ChromeDriver.
Selenium es una herramienta de prueba automatizada que puede impulsar al navegador a realizar acciones específicas, como hacer clic y arrastrar, y también puede obtener el código fuente de la página actualmente representada por el navegador para poder capturarla. mientras esté visible Elegir. Para algunas páginas JavaScript representadas dinámicamente, este método de rastreo es muy eficaz.
Para ingresar a la página de libros más vendidos de Dangdang.com, debe usar Selenium para capturar la información del libro y usar pyquery para obtener la clasificación, las imágenes, el nombre, el precio, las reseñas del libro y otra información del libro.