Red de conocimiento informático - Conocimiento sistemático - ¿Cómo configurar la capa de aplanamiento de caffe para el aprendizaje profundo?

¿Cómo configurar la capa de aplanamiento de caffe para el aprendizaje profundo?

La capa plana se usa para aplanar parámetros, generalmente entre la capa convolucional y la capa de enlace completo. Se puede ver en la red VG16, pero en redes posteriores, GlobalAveragePooling2D se usa para reemplazar la capa plana. De la comparación de las redes VG16 e inceptionV3. Se puede ver. De la comparación de parámetros se puede ver que esta mejora reduce en gran medida el uso de parámetros y evita el sobreajuste.

Importar secuencia desde keras.models

Importar aplanamiento desde keras.layers.core

Desde keras.layers.convolution importar convolution2D

Importar modelo_dibujo desde keras.utils.vis_utils

model=order()

model.add(Convolution2D(64, 3, 3, border_mode="same", input_shape=(3, 32, 32)).

# ahora: model.output_shape==(Ninguno, 64, 32, 32)

model.add(Flatten())

# ahora: model.output_shape==(None, 65536)

plot_model(model, to_file='Flatten.png', show_shapes=True)

Datos extendidos

Aplicación de aplicación

Visión por computadora

El Laboratorio Multimedia de la Universidad China de Hong Kong es el primer equipo chino que aplica el aprendizaje profundo a la investigación de visión por computadora en el mundo. En la competencia de inteligencia artificial de clase mundial LFW (Competencia de reconocimiento facial a gran escala), el laboratorio derrotó a FaceBook y ganó el campeonato, lo que hizo que la capacidad de reconocimiento de la inteligencia artificial en este campo supere por primera vez a la de las personas reales.

Reconocimiento de voz

A través de la cooperación con Hinton, los investigadores de Microsoft introdujeron RBM y DBN en el entrenamiento de modelos acústicos para el reconocimiento de voz por primera vez y lograron un gran éxito en sistemas de reconocimiento de voz de gran vocabulario, reduciendo la tasa de error. del reconocimiento de voz en un 30%. Actualmente no existe un algoritmo rápido paralelo eficaz para DNN. Muchas instituciones de investigación están utilizando corpus de datos a gran escala para mejorar la eficiencia del entrenamiento de los modelos acústicos DNN a través de plataformas GPU. Empresas como IBM y Google ya lo han hecho. El reconocimiento de voz DNN se ha estudiado rápidamente y la velocidad es muy rápida.

En China, empresas o unidades de investigación como Alibaba, iFlytek, Baidu y el. El Instituto de Automatización de la Academia de Ciencias de China también está llevando a cabo investigaciones sobre aprendizaje profundo en reconocimiento de voz.

Enciclopedia Baidu: aprendizaje profundo

.