Red de conocimiento informático - Computadora portátil - Utilizando redes profundas y revolucionarias para realizar la detección automática de grietas a nivel de píxeles en la superficie de las presas

Utilizando redes profundas y revolucionarias para realizar la detección automática de grietas a nivel de píxeles en la superficie de las presas

Detección automática de grietas a nivel de píxeles en la superficie de la presa mediante una red revolucionaria profunda

Documento: Detección automática de grietas a nivel de píxeles en la superficie de la presa basada en una red de participación profunda

Recibido: 2020.01.17

La mayoría de la detección de grietas en presas solo puede lograr la clasificación de grietas y su ubicación aproximada. La detección de segmentación semántica a nivel de píxeles puede proporcionar resultados de detección más precisos e intuitivos. Se propone un algoritmo de detección de grietas en la superficie de una presa basado en una red convolucional profunda. Primero, se utilizan drones para recopilar datos, luego las imágenes recopiladas se preprocesan (incluido el corte y la anotación manual) y, finalmente, se entrena, verifica y prueba la estructura de red CDDS diseñada.

Comparar segnetu-netfcn basado en resnet152. ?

La presa es una importante estructura de conservación de agua de la central hidroeléctrica. El funcionamiento seguro de las represas es de gran importancia para las centrales hidroeléctricas. Las grietas causadas por deformaciones estructurales, terremotos y flujos de agua tienen un impacto grave en el cuerpo de la presa, amenazando el funcionamiento seguro de las centrales hidroeléctricas. Por lo tanto, la evaluación periódica del estado de las estructuras de las presas, especialmente la detección de grietas, adquiere particular importancia.

Con base en las características estructurales y la resistencia a las grietas de la presa, se puede evaluar y monitorear la salud estructural de la presa. Las tareas tradicionales de detección de grietas en presas generalmente se basan en la detección manual, que es ineficiente, requiere mucho tiempo y mano de obra, y desperdicia muchos costos de mano de obra, por lo que es muy necesario detectar grietas de forma automática y eficiente.

Los algoritmos de detección de grietas basados ​​en visión por ordenador han sido ampliamente estudiados. La mayoría de estos métodos utilizan técnicas tradicionales de procesamiento de imágenes y métodos de aprendizaje automático para identificar algunos daños estructurales simples.

Estos métodos utilizan características extraídas manualmente para extraer características de las imágenes y luego evaluar si las características extraídas representan defectos. Sin embargo, los resultados de los métodos anteriores se ven inevitablemente afectados por factores subjetivos.

La red neuronal convolucional (CNN) ha logrado grandes avances en el campo de la clasificación y el reconocimiento de imágenes, y el algoritmo de detección de grietas basado en CNN también ha mostrado un buen rendimiento.

Características de las grietas de la presa:

Desventajas como marcas de reparación, ruido fuerte, textura de fondo compleja, falta de estructura, distribución desigual, ubicaciones aleatorias de las grietas y fondo borroso.

Se propone un método de detección de grietas en la superficie de la presa a nivel de píxeles y se utiliza una red convolucional profunda para la extracción de características. Con base en las características de posicionamiento de la capa convolucional superficial y las características abstractas de la capa convolucional profunda, se realiza una fusión en cascada de convolución multiescala y un cálculo del valor de pérdida multidimensional para lograr la segmentación a nivel de píxel de los defectos de las grietas y resolver el problema de la presa con Se eliminan las ventajas de alta precisión y alta eficiencia. Se elimina el problema obvio de detección de grietas en la superficie, se eliminan posibles riesgos de seguridad y se garantiza la seguridad de la superficie de la presa. Los resultados experimentales muestran que este método es la mejor manera de detectar grietas a nivel de píxeles en la superficie de la presa.

Segmentación Semántica

PSPNet [42], ICNet [43], Deeplabv3[44], UNet [45] y SegNet [46]

Redes de Segmentación Semántica Generalmente se dividen en redes de codificación y redes de decodificación.

Red de codificación:

Capa convolucional: utilizada para extraer características de la imagen de entrada.

Capa de agrupación: reduce el tamaño del mapa de características y reduce la carga computacional.

Red de decodificación:

Capa de deconvolución (capa de deconvolución): el muestreo superior restaura el mapa de características con el mismo tamaño que la imagen de entrada y genera el resultado de la predicción.

La estructura de la red de codificación y decodificación es muy simétrica: se utilizan mapas de características dispersas y mapas de características densas al mismo tiempo.

Para integrar funciones escasas y densas, se utiliza un módulo de omisión para conectar la red de códecs.

Red de codificación:

15 capas convolucionales: ¿3*3? Zancada 1

4 capas de agrupación: 2*2 zancada 2

Red de decodificación:

15 capas de deconvolución 1*1

4 agrupación capa

La deserción y la BN se utilizan para evitar el sobreajuste.

Saltar rama

4. Convolución y deconvolución 1*1.

La pérdida de rama se calcula para cada rama y la cascada de pérdidas de cuatro ramas es parte de la pérdida total.

Los tamaños de las imágenes de entrada y salida permanecen sin cambios para las ramas omitidas.

El número de canales del núcleo de convolución debe ser igual al número de canales del tensor de entrada.

El tamaño máximo del núcleo de convolución de la matriz de reducción de resolución es 2*2 y el tamaño del paso es 2.

La deconvolución también se llama convolución transpuesta

El mapa de características recuperado mediante muestreo ascendente tiene el mismo tamaño que la imagen de entrada.

Métodos de upsampling: deconvolución e interpolación.

Método de deconvolución: rellene la capa más externa con un tensor de relleno de ceros, luego use el núcleo de deconvolución para deconvolucionar y recorte la primera y la última línea.

1000 5472*3648 imágenes

Utiliza el software LEAR para marcar manualmente.

Se obtuvieron 504 conjuntos de datos, 404 para entrenamiento, 50 para validación y 50 para prueba.

Compile en Linux usando TensorFlow.

La capacitación, la validación y las pruebas se realizaron en estaciones de trabajo HP con GPU de 8 GB.

Anaconda establece el entorno virtual Python de la red CDDS.

Índice de evaluación:

Exactitud La precisión indica la probabilidad de que, entre todas las muestras que se predice que serán crackeadas, la autenticidad básica de la muestra también lo esté.

La recuperación representa la probabilidad de que se prediga que una muestra será agrietada entre todas las muestras marcadas como agrietadas. Cuando la diferencia entre el número de muestras positivas y negativas es grande, no es razonable utilizar únicamente la precisión o la recuperación para evaluar el rendimiento. TPR representa la probabilidad de que todas las muestras marcadas como grietas se predigan correctamente como grietas. TNR representa la probabilidad de que se prediga correctamente como fondo entre todas las muestras con etiqueta como fondo.

La medida F considera de manera integral el impacto de la recuperación y la precisión.

IoU es un método común para evaluar la precisión del posicionamiento en el campo de la detección de objetivos. IoU representa la relación entre la intersección y la unión del resultado de la predicción y el valor real del terreno.

La imagen de las grietas de la superficie de la presa se puede dividir en fondo y grietas. La cantidad de píxeles de fondo es mucho mayor que la cantidad de píxeles agrietados. Por lo general, calculamos los atrasos en el backend y los atrasos en el crack al mismo tiempo, y luego tomamos el promedio de los dos como atrasos finales. El valor de IoU está determinado por los píxeles de fondo y no puede expresar con precisión la precisión de posicionamiento de la grieta.

Utiliza tres ritmos de aprendizaje: 10 4, 10 5, 10 6.

Utiliza la función softmax para calcular la probabilidad.

Calcule la pérdida de red utilizando la pérdida de dados.

Extracción de esqueleto de crack: algoritmo de refinamiento rápido

Llame a la biblioteca OpenCV para realizar el cálculo.

Calcular área, longitud y ancho de grieta.

Se utilizan otros conjuntos de datos de fracturas para la validación complementaria. En el conjunto de datos de prueba, el IOU y la medida F de la red CDDS propuesta alcanzaron 67,45438 0 y 80,14 respectivamente.

Un poco.