Red de conocimiento informático - Conocimiento informático - ¿Qué es scratch para la programación infantil?

¿Qué es scratch para la programación infantil?

Para un proyecto de desarrollo de ingeniería de software se debe comenzar con la obtención de datos. No importa cómo se procese el texto, el aprendizaje automático y la minería de datos requieren datos, además de los datos profesionales comprados o descargados a través de algunos canales, a menudo necesitamos rastrear los datos nosotros mismos, lo que es particularmente importante. ¿Juegos de herramientas? ¿Qué? Déjame presentártelos uno por uno.

1. BeautifulSoup

Objetivamente hablando, BeautifulSoup no es completamente un conjunto de herramientas de rastreo que deben usarse junto con urllib, sino un conjunto de análisis y limpieza de datos HTML/XML. y herramientas de adquisición.

2. Scrapy

Scrapy es similar a Scrapy, un marco rápido de rastreo de pantalla y rastreo web de alto nivel

para

Python. Creo que muchos estudiantes han oído hablar de él. it Curso Muchos cursos en el mapa se capturan en base a Scrapy. Hay muchos artículos introductorios en esta área. Recomiendo un artículo escrito por Daniel Pluskid en sus primeros años: "Scrapy

Fácil personalización del rastreador web. ", que permanece fresco durante mucho tiempo.

3. Python-Goose

Goose se escribió primero en Java y luego se reescribió en Scala. Es un proyecto de Scala. Python-Goose se reescribe en Python y se basa en Beautiful

Soup. Dada la URL de un artículo, es muy conveniente obtener el título y el contenido del artículo, y es muy agradable de usar.

Lo anterior es una introducción al conjunto de herramientas del rastreador web de programación Python. Espero que pueda ser útil para todos los que hacen programación en Python. Por supuesto, aprender a programar en Python no solo requiere el aprendizaje de herramientas, sino también mucho. de conocimientos de programación, que también hay que aprender bien. ¡Levántate, vamos!