Cómo utilizar Python para obtener información de página dinámica
Solución:
Existe una forma más sencilla de analizar dinámicamente la información de la página. La información procesada que se muestra en el navegador es en realidad un documento HTML procesado. Esto proporciona una excelente manera de capturar información dinámica de la página. En Python, existe una biblioteca de gráficos muy famosa, PyQt. Aunque PyQt es sólo una biblioteca de gráficos, el QtWebkit que incluye es muy útil. El navegador Chrome de Google y el navegador Safari de Apple se basan en el kernel WebKit, por lo que podemos usar QtWebKit en PyQt para leer y cargar información de la página en un documento HTML, luego analizar el documento HTML y extraer el contenido que queremos de la información del documento HTML. para ser utilizado.
El autor utiliza Mac OS X.
1. Biblioteca Qt4
Biblioteca, no Creador. La biblioteca está en la ruta de instalación predeterminada de Mac, que debe ser /home/nombre de usuario/Desarrollador/. No cambie la ruta de instalación predeterminada de Qt4. De lo contrario, la instalación puede fallar.
URL oficial:/snakewu1994/StyleBasis_Four/en_album_607236.shtml")
Parser = MyParser()
Parser.feed(browser.html)
imprimir "Listo"
browser.close()
Usando este programa, puedes descargar todas las imágenes de la página con solo unas simples líneas. Esta difícil tarea. Este es de hecho el punto fuerte del lenguaje Python, y luego esta difícil tarea se deja en manos de un tercero.