Red de conocimiento informático - Problemas con los teléfonos móviles - tf.feature_column Resumen de ingeniería de funciones prácticas

tf.feature_column Resumen de ingeniería de funciones prácticas

Entero directo onehot, lista de palabras especificada onehot, reducción de dimensionalidad hash onehot y columna continua de características discretas incrustadas, las tres primeras procesan características de cadena/enteras en vectores onehot 0/1.

Si la columna de características discretas en sí es una representación entera continua (a partir de 0), se puede asignar directamente a una variable discreta. El número máximo de valores se especifica de antemano. Si excede, se completará con el valor predeterminado, que es adecuado para el uso original de la codificación de ID de entero, y la atmósfera de codificación no es una característica discreta grande. Si la lista de valores entrantes contiene varios elementos, puede implementar mutihot, pero el. el número de elementos de la lista debe ser el mismo

Si la característica discreta es una cadena (también puede ser un número entero) y el rango de valores no es muy grande, puede utilizar esta interfaz para definir. el valor de una característica discreta Cuando aparece un nuevo valor, puede asignar una nueva posición de índice o un nuevo valor. Cuando aparece un nuevo valor, se le puede asignar una nueva posición de índice o asignarlo a una posición existente. El mapeo de vocabulario también admite mutihot.

Si se establece num_oov_buckets=0, o no se establece el valor predeterminado, se crea nuevo. Las palabras se ignorarán

Otra configuración también puede manejar nuevos problemas escritos y asignarlos directamente a diferentes palabras, por ejemplo, llamando a otras palabras

Prueba multihot, lo mismo si el elemento aparece múltiple veces seguidas, el recuento será mayor que 1

Si la columna es una variable discreta de cadena (también puede ser un número entero, se admiten tanto enteros como cadenas) y tiene múltiples valores, por ejemplo, ". .....", el conteo será mayor que 1. g.,ID, puede usar esta interfaz

Si la entrada es un valor entero, use la configuración dtype dtype=tf.int32, internamente, el valor entero es 0. int32, internamente el número entero se convertirá en una cadena y luego se aplicará un hash

Los números enteros, las listas de palabras y los hash se discretizan directamente mediante Indicator_column, las matrices onehot se pueden usar incrustando listas de palabras aleatorias en el medio. Embedding_column se busca más a fondo en un vector denso incrustado, y luego la matriz onehot se puede discretizar en un vector denso incrustado a través de embedding_column. Incrustar vectores densos De forma predeterminada, la incrustación puede seguir el modelo para continuar con el entrenamiento, es decir, trainable = True. Para mutihot, la incrustación admite combinaciones de vectores de media, sqrtn y suma

1.do incrustación después de hash <. /p>

2. Incrustar después de onehot en la lista de palabras

3. Incrustar después de onehot en el número entero

Incrustar de Mutihot

tf.feature_column tiene dos Hay dos interfaces para manejar variables continuas: valores continuos que se asignan directamente a variables continuas y valores continuos que se asignan directamente a variables continuas. Mapa a variables continuas, los valores continuos se discretizan, la interfaz es la siguiente

Después de la discretización, se pueden incrustar variables continuas

tf.feature_column.crossed_column se puede utilizar para cruzar combine características discretas, mejorando así el rendimiento de la capacidad del modelo de representación. cross_column.puede combinar funciones discretas Feature_column.