¿Cómo eliminar la falta en el marco de datos de Python?
1. Importe las bibliotecas necesarias. importar pandas como pd, importar numpy como np, desde sklearn.preprocessing importar Imputer.
2. DataFrame({'nombre':, 'Matemáticas':, 'Chino':[np.nan,78,96,np.nan,75 ]}), imprimir(datos).
3. Valores faltantes. data.isnull()#Ver todos los valores faltantes, data.isnull().any()#Obtener columnas que contienen valores faltantes, data.isnull().all()#Obtener todas las columnas NA.
4. Eliminar los valores faltantes. data2=data.dropna().print(data2) Puede ver que solo quedan dos filas de datos después de la eliminación.
5. Utilice sklearn para reemplazar los valores faltantes. Cuando los valores faltantes son datos numéricos, se puede utilizar la media para reemplazarlos.
6. Utilice pandas para reemplazar los valores faltantes.
data.fillna(0) # Reemplazar los valores faltantes con 0.
Extensiones
El método de ejecución de Python es compilar primero el código fuente en el archivo py en código de bytes de Python y luego ejecutar el código compilado mediante la máquina virtual Python (Python Virtual Máquina) . La idea básica de este mecanismo es la misma que la de Java y NET.
Sin embargo, la máquina virtual Python es diferente de la máquina virtual de Java o .NET. La máquina virtual Python es una máquina virtual más avanzada.
Avanzado aquí no es avanzado en el sentido habitual. No significa que la máquina virtual Python sea más poderosa que Java o .NET.
Significa que en comparación con Java o . .NET, la máquina virtual Python La máquina está más alejada de la máquina real.
La máquina virtual de Python es una máquina virtual con un mayor nivel de abstracción.
Archivo de código de bytes compilado en Python basado en lenguaje C, generalmente en formato pyc. Además, Python también se puede ejecutar en modo interactivo. Por ejemplo, los principales sistemas operativos Unix/Linux, Mac y Windows pueden ejecutar el entorno interactivo de Python directamente en modo de comando. Las operaciones interactivas se pueden lograr emitiendo comandos directamente.
Uno de los objetivos de diseño de Python es hacer que el código sea altamente legible. Python está diseñado para ser simple y hermoso mediante el uso de signos de puntuación y palabras individuales que se usan a menudo en otros idiomas.
No requiere declaraciones declarativas repetidas como otros lenguajes estáticos como C y Pascal, ni su sintaxis suele presentar casos especiales y sorpresas.
Los desarrolladores de Python hacen intencionalmente que los programas que violan las reglas de sangría no sean compilables para obligar a los programadores a desarrollar buenos hábitos de programación.
El lenguaje Python utiliza sangría para indicar el principio y el final de bloques de declaraciones (reglas fuera de juego), en lugar de paréntesis o algún tipo de palabra clave. Una sangría creciente indica el comienzo de un bloque de instrucciones, mientras que una sangría decreciente indica la salida de un bloque de instrucciones. La sangría se convierte en parte de la sintaxis.