Red de conocimiento informático - Espacio del host - Quiero aprender Python para el análisis de datos. ¿Cuánto tiempo lleva aprender?

Quiero aprender Python para el análisis de datos. ¿Cuánto tiempo lleva aprender?

Unos cinco meses, este es el tiempo de formación. Si estudias solo, el tiempo es incierto, pero puedes hacer una pequeña estimación y te llevará el doble.

Existen principalmente las siguientes instrucciones:

1. Verificar la tabla de datos

La función de forma se usa en Python para verificar las dimensiones de la tabla de datos. es decir, el número de filas y el número de columnas. Puede utilizar la función de información para ver la información general de la tabla de datos y la función dtypes para devolver el formato de los datos. Isnull es una función en Python que busca valores nulos. Puede verificar toda la tabla de datos o puede verificar una columna individualmente en busca de valores nulos. El resultado devuelto es un valor lógico que se devuelve si se incluye un valor nulo. Si no es así, se devuelve false. Utilice la función única para ver valores únicos y la función Valores para ver valores en la tabla de datos.

2. Limpieza de la tabla de datos

El método para manejar valores nulos en Python es relativamente flexible. Puede utilizar la función Dropna para eliminar datos que contengan valores nulos. tabla, o puede usar la función fillna. Complete los valores vacíos. En Python, dtype es una función para ver el formato de datos. La función correspondiente es la función astype, que se utiliza para cambiar el formato de datos. Rename es una función para cambiar los nombres de las columnas. La función drop_duplicates elimina valores duplicados. implementa el reemplazo de datos.

3. Preprocesamiento de datos

El preprocesamiento de datos consiste en organizar los datos limpios para estadísticas y análisis posteriores, lo que incluye principalmente la fusión, clasificación y clasificación numérica de tablas de datos, y agrupación de datos. etiquetado, etc En Python, puede usar la función de combinación para fusionar dos tablas de datos. El método de combinación es interno y también hay métodos izquierdo, derecho y externo. Utilice la función ort_values ​​​​y la función sort_index para completar la clasificación, use la función donde para completar la agrupación de datos y use la función de división para lograr la separación de columnas.

4. Extracción de datos

Utilice principalmente tres funciones: loc, iloc e ix. La función loc extrae por valor de etiqueta, iloc extrae por posición y ix se puede presionar al mismo tiempo. Se extraen las etiquetas y ubicaciones. Además de extraer datos por etiqueta y ubicación, también puede extraer datos según condiciones específicas. Por ejemplo, puede utilizar las funciones loc e isin juntas para extraer datos según condiciones específicas.

5. Resumen de filtrado de datos

En Python, la función loc se utiliza junto con las condiciones de filtrado para completar la función de filtrado. Con las funciones de suma y conteo, las funciones del. También se pueden realizar las funciones sumif y countif en Excel. Las principales funciones utilizadas en Python son groupby y pivot_table. Groupby es una función para clasificar y resumir. El método de uso es muy simple. Simplemente especifique el nombre de la columna que se agrupará. También puede especificar varios nombres de columnas al mismo tiempo.