Python es realmente muy simple. Capítulo 19 Serie Panda y marco de datos
Anaconda es una versión de distribución de código abierto de Python, preinstalada con un amplio conjunto de bibliotecas de terceros, principalmente para informática científica y análisis de datos. Su uso ahorra más tiempo y trabajo que el Python original.
El sitio web oficial de descarga de Anaconda es: https://www.continuum.io/downloads. El método de descarga e instalación es muy sencillo. Si tienes alguna pregunta, puedes buscar contenido relevante en línea y aprender a resolverla.
Después de instalar Anaconda, encontrará que herramientas como Jupyter Notebook y Spyder están instaladas en el directorio de Anaconda. A continuación, usaremos principalmente Spyder para el desarrollo. Spyder es muy sencillo de usar y también puedes buscar y aprender en línea.
Aunque Anaconda tiene muchos paquetes de uso común preinstalados, a veces todavía necesitamos instalar algunos paquetes nosotros mismos. Puede seleccionar el comando "Anaconda Anaconda Prompt" en el menú de inicio, ingresar conda install (que representa el nombre del paquete) en la línea de comando para instalar o ingresar pip install.
19.2 Paquete de análisis de datos Panda
Pandas es un paquete de análisis de datos para Python, y el paquete Pandora tiene instalado Anaconda.
Hay tres tipos de estructuras de datos panda: Serie (matriz unidimensional), DataFrame (matriz bidimensional) y Panel (matriz tridimensional). Las dos primeras estructuras de datos son las más comunes. usado.
19.2.1 Serie
La serie se utiliza para almacenar una fila o columna de datos y la colección de índice asociada.
El formato de sintaxis es el siguiente:
Serie()
Material impreso
Los resultados de salida son los siguientes:
1 pieza de tres
李思
3王武
dtype: object
El índice se especifica al crear la secuencia anterior. Si no se especifica, el valor del índice predeterminado comienza desde 0. Como se muestra a continuación:
s = serie (
Material impreso
Resultado de la ejecución:
0 piezas de tres
1 Li Si
2 Wang Wu
3 Sun Liu
dtipo: objeto
(4) Eliminar elemento
de pandas importar serie
s = serie(
(3) eliminar fila
Df.drop(1, eje=0) # eje =0 Indica el eje de la fila, que también se puede omitir
(4) Eliminar la columna
Df.drop ('gender ', axis=1) # axis=0 indica. el eje de la columna.
También puedes usar otro método:
Del df['Gender']
(5) Agregar una columna
Df['Teléfono' ]=[' 1111111 ', ' 222222 ', ' 333333']
Imprimir (df)
Resultados de ejecución:
Nombre, sexo, edad, número de teléfono Número
0Tres hombres18 1111111.
1 Li Sinu 19 2222222
2 Wang Wunan 17 3333333
(6) Agregar líneas
Df.loc[len( df )]=['Sun Liu','M',' 20']
(7)Agregar
Desde Panda Import Series
Desde Panda Import Data marco
Nombre = Serie(['Zhang San', 'Li Si', 'Wang Wu'])
Género = Serie(['Hombre', 'Mujer', ' Hombre'])
Edad=Serie([18, 19, 17])
Df=DataFrame({' nombre': nombre, 'género': sexo, 'edad' : edad}) #Crea un DataFrame con una variable llamada Df.
nombre 1 =Serie(['Sun Liu','Hou Qi'])
sexo 1 =Serie(['Hombre','Mujer'])
Edad 1 = serie([19, 17])
df 1 = marco de datos({ 'nombre': nombre 1, 'género': sexo1, 'edad': edad1}) p>
#Crea un DataFrame usando una variable llamada df1.
df=df.append(df1, ignore_index=True)
#Agregue df1 a df, el parámetro ignore_index=True significa volver a indexar.
Imprimir (df)
Resultados de la ejecución:
Nombre, sexo y edad
0 Zhang Sannan 18
1 Li Sinu 19
2 Wang Wunan 17
3 Sun Liunan 19
4 Esperando a siete chicas 17