Cómo aprender sistemáticamente matplotlib, numpy, scipy y pandas en Python
Aprender sistemáticamente las bibliotecas de análisis de datos de Python (Numpy, Scipy, Pandas, etc.) es una propuesta falsa. El aprendizaje realmente efectivo debería basarse en el análisis de datos reales.
Salir
Aprender sin un combate real es como hablar en papel. Sólo experimentando la prueba del combate real podremos dominar verdaderamente lo que hemos aprendido. En el pasado, cuando el encuestado estaba aprendiendo estas bibliotecas, pasaba mucho tiempo estudiando y practicando varios tutoriales. Sin embargo, en el proceso real del proyecto, todavía estaba presionado y necesitaba pasar mucho tiempo revisando documentos e yendo a Google. Busque respuestas. Si piensas en la razón, es simplemente porque has aprendido "sistemáticamente" una gran cantidad de funciones y funciones en la superficie, pero si no puedes aplicar lo que has aprendido, no podrás lograr el dominio y el dominio.
Para principiantes, el primer paso es establecer una comprensión básica de estas bibliotecas según el tutorial. Puede consultar los siguientes materiales:
Material recomendado: Python para análisis de datos
Motivo de la recomendación: este libro es muy completo y detallado y cubre varios datos importantes, como Numpy y Scipy. Biblioteca de análisis. Sin embargo, las deficiencias de este libro son tan obvias como las ventajas. La razón principal es que se escribió demasiado pronto (revisado por última vez en 2012), parte del contenido está un poco desactualizado y debido a que la explicación es muy detallada, muchos de ellos. Los contenidos no son aptos para principiantes.
Sugerencias de lectura: lea atentamente los primeros cinco capítulos, copie el código del libro y pueda depurarlo y ejecutarlo correctamente. Lea los siguientes capítulos según sea necesario. Después de establecer la comprensión básica, es necesario fortalecerla mediante el combate real. Puede consultar los siguientes materiales:
Harvard CS109 Data Science
Algunos estudiantes han mencionado este curso antes, pero. Todavía necesitan volver a tener algo de tranquilidad. Las principales razones para recomendar este curso son las siguientes
Hay tutoriales en vídeo que no serán demasiado aburridos.
Abarca una amplia gama de temas y es de dificultad moderada, apto para principiantes.
El curso incluye contenidos como teoría de la probabilidad, estadística matemática y aprendizaje automático, que son herramientas analíticas comúnmente utilizadas en el trabajo práctico.
Se combinan teoría y práctica, con Python como principal lenguaje de programación.
Implica un pequeño análisis de texto, MapReduce, Spark, etc.
2. Competencia de Kaggle
Si desea obtener más información sobre cómo usar Python para datos Análisis, entonces, Kaggle debe ser la mejor opción. Aquí se reúnen expertos en análisis de datos de todo el mundo y la comunidad es muy activa.
También hay muchos concursos y proyectos interesantes. Desde reconocedores de números adecuados para principiantes y predicciones de la tasa de supervivencia del Titanic, hasta concursos con premios de decenas o incluso cientos de miles de dólares, pasando por concursos organizados por grandes empresas, como Facebook, Walmart, etc., o concursos orientados al reclutamiento, siempre puedes encuentre uno que se adapte a sus necesidades
En cuanto a otras preguntas mencionadas por el autor de la pregunta, mi respuesta es:
¿Es Python suficiente para la minería de datos?
Python es poderoso para la minería de datos, muy poderoso, muy poderoso. Los departamentos de datos de la mayoría de las empresas de alta tecnología se basan principalmente en Python y R, y cada vez más departamentos de datos en las industrias tradicionales también están probando el análisis de datos de Python.
¿Qué conocimientos necesitas aprender para aprender minería de datos?
Puede consultar la publicación más candente: ¿Cómo convertirse en un científico de datos? La minería de datos es una de las habilidades que debe tener un científico de datos. Los expertos ya han brindado métodos sobre cómo convertirse en un científico de datos. síguelo Eso es todo.