Red de conocimiento informático - Computadora portátil - Clasificación de imágenes de redes neuronales CNN (Matlab)

Clasificación de imágenes de redes neuronales CNN (Matlab)

Necesitas ver cuál es tu imagen. Si es un número de color, conviértalo primero a gris. Red de formación con MNIST. Si se trata de una variedad de temas, utilice imageNET colorido para la capacitación. Si sus datos son lo suficientemente grandes como para coincidir con el conjunto de datos, puede entrenar la red directamente con sus datos.

Después de entrenar en conjuntos de datos populares, debe arreglar la capa de agrupación convolucional, entrenar solo los parámetros de las capas posteriores completamente conectadas y usar su propio conjunto de datos.

El primero es ajustar la estructura de la red, agrupar varias capas de convolución y el tamaño de la plantilla de la convolución. En cambio, existen parámetros, como escala de peso, tasa de aprendizaje, registro, etc. , ajustado según la estructura determinada.

Cuando usa CNN para clasificar imágenes, no es más que usar CNN como un medio para aprender funciones. Puedes pensar en la red como dos partes. La capa convolucional anterior aprende las características de nivel básico, medio y alto de la imagen, y la siguiente capa completamente conectada corresponde a la red neuronal ordinaria para su clasificación.

Si necesitas aprender, primero debes acudir al tutorial de la UFLDL. Entonces cs231n

En lugar de preguntar a otros, ¿alguna vez ha mirado primero el conjunto de datos de imageNet?

Para métodos de entrenamiento de modelos mezclando conjuntos de datos populares con sus propios datos. Esto también es posible si los dos datos son muy similares. Sin embargo, para conjuntos de datos populares, la cantidad de datos etiquetados por sí mismos generalmente no es demasiado grande. Si la proporción es 1:1000, 1:100, entonces un modelo entrenado completamente utilizando el conjunto de datos, sin agregar sus propios datos, puede obtener un buen resultado.

Si hay algunas diferencias entre mis propios datos y el conjunto de datos, creo que mis propios datos se agregan al conjunto de datos como ruido. CNN cree que las imágenes son relevantes a nivel local, pero el método para engañar a CNN se debe principalmente a que las imágenes naturales se distribuyen en una estructura múltiple. El modelo entrenado requiere esta suposición múltiple, y las imágenes sintetizadas artificialmente causarán serios problemas debido a la adición de ruido no natural. Interfiere con los resultados de la clasificación y no cumple con los supuestos del modelo.

Si la diferencia entre los dos es demasiado grande, el conjunto de datos es una distribución y sus datos son otra distribución. No lo he probado juntos, pero no creo que los resultados sean demasiado buenos.

En este momento, el conjunto de datos solo se puede utilizar para entrenar las capacidades de extracción de características de CNN. Luego, la capa completamente conectada utilizada para la clasificación se escala de acuerdo con la cantidad de datos.