Red de conocimiento informático - Aprendizaje de programación - grupoporjava

grupoporjava

¿Qué es groupby java? ¿Descubrímoslo juntos?

La función de groupby es dividir un conjunto de datos en varias áreas pequeñas a través de ciertas reglas y luego realizar el procesamiento de datos en varias áreas pequeñas. El uso principal de groupby es utilizar el contenido de una o más columnas. de sí mismo. Realizar la agregación del grupo.

El uso principal de groupby:

(1) Agrupar y agregar según el contenido de una o más columnas del propio DataFrame (a) Si se agrega por una determinada columna, el nuevo DataFrame se basará en El contenido de una determinada columna se divide en diferentes dimensiones para su desmontaje y, al mismo tiempo, se agrega la misma dimensión (b) Si se agrega en varias columnas, el nuevo DataFrame será el producto cartesiano de. las dimensiones entre múltiples columnas, es decir: el nuevo DataFrame tiene un índice jerárquico (compuesto por pares de claves únicos), por ejemplo: la columna "clave1" tiene dos dimensiones a y b, y "clave2" tiene dos dimensiones uno y dos, entonces la columna "key1" y la agregación "Después de key2", el nuevo DataFrame tendrá cuatro grupos;

Nota: groupby por defecto agrupa en el eje=0. Al establecer el eje=1, también se puede agrupar en. cualquier otro eje.

(2) groupby, dependiendo de la clave de agrupación, existen los siguientes 4 métodos de agregación:

1. La clave de agrupación es Serie.

(a) Utilice la subcolumna del df original como Serie.

df.groupby() #Matriz personalizada

df['data1'].groupby( [ estados,años ] ).mean()

4 , la clave de agrupación es un diccionario.

mapeo={'a':'rojo','b':'rojo','c':'azul','d':'azul','e':'rojo', 'f':'orange'} #Diccionario personalizado.

by_column=people.groupby(mapping,axis=1).sum() #Especifique el eje=1 para agregar y agrupar datos de columnas.

5. La tecla de agrupación es una función.

Por ejemplo: pase la función len (que puede obtener una matriz de longitudes de cadena) para lograr la agrupación según la longitud de la cadena.

people.groupby(len).sum() #Suma las líneas con la misma longitud de cadena.

5. La clave de agrupación es una combinación de función y matriz, lista, diccionario y serie.

Introduzca list[ ] y mezcle funciones con matrices, listas, diccionarios y series como claves de agrupación para la agregación, porque eventualmente todo se convertirá en una matriz.

key_list=['one', 'one', 'one', 'two', 'two'] #Lista personalizada, el orden de la lista predeterminado es consistente con el orden de las columnas de df.

people.groupby([ len,key_list ]).min()

6. La clave de agrupación es una jerarquía de índice de columnas con múltiples índices de columnas df.

hier_df.groupby(level=‘cty’,axis=1).count() #Utilice el parámetro nivel para indicar el nivel de agregación.

Descripción del ejemplo de código:

Empalme varios campos en un nuevo campo y utilice groupBy de Java8 para agrupar.

Map?detailmap?=?details.stream() .collect(Collectors.groupingBy(d?->?fetchGroupKey(d)?)); private?String?fetchGroupKey(EntryDeliveryDetailywk?detail){ return?detail.getSkuId(). toString()? +?detail.getItemsName()? +?detail.getWarehouseId().toString() +?detail.getSupplierId().toString();