Red de conocimiento informático - Material del sitio web - Cómo utilizar Python para rastrear datos de comentarios de sitios web

Cómo utilizar Python para rastrear datos de comentarios de sitios web

Si un producto tiene 20.000 reseñas y 15.000 reseñas predeterminadas, no se mostrarán las 15.000 reseñas predeterminadas. Entonces solo podremos capturar 5w de datos. A continuación, capturaremos todas las reseñas positivas, reseñas positivas, reseñas negativas, reseñas negativas y comentarios adicionales, pero incluso estos datos suman menos de 50.000. Los bloggers anteriores especulan que puede haber dos razones:1. Hay falsificación de datos y es posible que se ignore el número

2. De hecho, hay tantos comentarios, pero es posible que el sistema solo muestre comentarios más nuevos y archive comentarios más antiguos.

Según la teoría del blogger, he realizado muchas pruebas, lo que significa que pase lo que pase, no podemos capturar otros 50.000 datos, solo podemos capturar una parte de ellos, pero esta parte de los datos Cerca de mil o algo así. Si tiene amigos que pueden recopilar más datos, no dude en agregarlos a la lista.

Idea general

Todas las reseñas, buenas reseñas, malas reseñas, malas reseñas y URL de reseñas adicionales involucran ciertos parámetros siempre que se modifiquen los parámetros recorridos en los datos de la página web. , El número de página puede completar todo el rastreo.