Red de conocimiento informático - Problemas con los teléfonos móviles - Python es realmente muy simple. Capítulo 19 Serie Panda y marco de datos

Python es realmente muy simple. Capítulo 19 Serie Panda y marco de datos

Instalar Anaconda

Anaconda es una versión de distribución de código abierto de Python, preinstalada con un amplio conjunto de bibliotecas de terceros, principalmente para informática científica y análisis de datos. Su uso ahorra más tiempo y trabajo que el Python original.

El sitio web oficial de descarga de Anaconda es: https://www.continuum.io/downloads. El método de descarga e instalación es muy sencillo. Si tienes alguna pregunta, puedes buscar contenido relevante en línea y aprender a resolverla.

Después de instalar Anaconda, encontrará que herramientas como Jupyter Notebook y Spyder están instaladas en el directorio de Anaconda. A continuación, usaremos principalmente Spyder para el desarrollo. Spyder es muy sencillo de usar y también puedes buscar y aprender en línea.

Aunque Anaconda tiene muchos paquetes de uso común preinstalados, a veces todavía necesitamos instalar algunos paquetes nosotros mismos. Puede seleccionar el comando "Anaconda Anaconda Prompt" en el menú de inicio, ingresar conda install (que representa el nombre del paquete) en la línea de comando para instalar o ingresar pip install.

19.2 Paquete de análisis de datos Panda

Pandas es un paquete de análisis de datos para Python, y el paquete Pandora tiene instalado Anaconda.

Hay tres tipos de estructuras de datos panda: Serie (matriz unidimensional), DataFrame (matriz bidimensional) y Panel (matriz tridimensional). Las dos primeras estructuras de datos son las más comunes. usado.

19.2.1 Serie

La serie se utiliza para almacenar una fila o columna de datos y la colección de índice asociada.

El formato de sintaxis es el siguiente:

Serie()

Material impreso

Los resultados de salida son los siguientes:

1 pieza de tres

李思

3王武

dtype: object

El índice se especifica al crear la secuencia anterior. Si no se especifica, el valor del índice predeterminado comienza desde 0. Como se muestra a continuación:

s = serie (

Material impreso

Resultado de la ejecución:

0 piezas de tres

1 Li Si

2 Wang Wu

3 Sun Liu

dtipo: objeto

(4) Eliminar elemento

de pandas importar serie

s = serie(

(3) eliminar fila

Df.drop(1, eje=0) # eje =0 Indica el eje de la fila, que también se puede omitir

(4) Eliminar la columna

Df.drop ('gender ', axis=1) # axis=0 indica. el eje de la columna.

También puedes usar otro método:

Del df['Gender']

(5) Agregar una columna

Df['Teléfono' ]=[' 1111111 ', ' 222222 ', ' 333333']

Imprimir (df)

Resultados de ejecución:

Nombre, sexo, edad, número de teléfono Número

0Tres hombres18 1111111.

1 Li Sinu 19 2222222

2 Wang Wunan 17 3333333

(6) Agregar líneas

Df.loc[len( df )]=['Sun Liu','M',' 20']

(7)Agregar

Desde Panda Import Series

Desde Panda Import Data marco

Nombre = Serie(['Zhang San', 'Li Si', 'Wang Wu'])

Género = Serie(['Hombre', 'Mujer', ' Hombre'])

Edad=Serie([18, 19, 17])

Df=DataFrame({' nombre': nombre, 'género': sexo, 'edad' : edad}) #Crea un DataFrame con una variable llamada Df.

nombre 1 =Serie(['Sun Liu','Hou Qi'])

sexo 1 =Serie(['Hombre','Mujer'])

Edad 1 = serie([19, 17])

df 1 = marco de datos({ 'nombre': nombre 1, 'género': sexo1, 'edad': edad1})

#Crea un DataFrame usando una variable llamada df1.

df=df.append(df1, ignore_index=True)

#Agregue df1 a df, el parámetro ignore_index=True significa volver a indexar.

Imprimir (df)

Resultados de la ejecución:

Nombre, sexo y edad

0 Zhang Sannan 18

1 Li Sinu 19

2 Wang Wunan 17

3 Sun Liunan 19

4 Esperando a siete chicas 17