Batalla de rastreadores de Python (1) Solicitud para rastrear películas de Douban TOP250
Tiempo de rastreo: 25/11/2020
Entorno del sistema: Windows 10
Herramientas utilizadas: Jupyter Notebook\Python 3.0
Involucradas bibliotecas: requestss\lxml\pandas\matplotlib\numpy
Idea de Danpang: primero, tome el nombre de la película, el título original, la calificación, el número de calificaciones y la información de clasificación del sitio web.
Idea de Danpang: después de imprimir la lista de datos, encontramos que el nombre original y la información de calificación de la película tenían algunos caracteres innecesarios, que requirieron preprocesamiento al mismo tiempo, ya que queremos hacer las dimensiones de; el mapa de distribución de películas TOP250 Douban, y la misma película tiene múltiples países y géneros de distribución (como "Francia, Estados Unidos, Drama, Acción, Crimen"), por lo que es muy importante comprender claramente la distribución de los títulos de la película. Guarde los datos en formato xlsx y trácelos en un gráfico de radar, un gráfico de barras y un gráfico de sectores, respectivamente.