Red de conocimiento informático - Aprendizaje de código fuente - ¿Cuál es el principio de expansión en el procesamiento de imágenes digitales?

¿Cuál es el principio de expansión en el procesamiento de imágenes digitales?

1. Principios básicos del refinamiento de imágenes

(1) Concepto de procesamiento morfológico de imágenes

El procesamiento morfológico en el procesamiento de imágenes digitales se refiere al uso de la morfología digital como herramienta para extraer imágenes de imágenes. Extrae componentes de la imagen que ayudan a expresar y representar la forma de la región, como límites, esqueletos y cascos convexos. También incluye filtrado, adelgazamiento y poda morfológicos para preprocesamiento o posprocesamiento. Nuestro principal interés en la morfología de imágenes radica en las imágenes binarias.

En una imagen binaria, el conjunto de todos los píxeles negros es la descripción morfológica completa de la imagen, y los componentes de la imagen binaria son los elementos de Z2. Supongamos que la imagen binaria A y el elemento estructural B procesado morfológicamente son un conjunto definido en una cuadrícula cartesiana. Los puntos con un valor de 1 en la cuadrícula son elementos del conjunto cuando el origen del elemento estructural se mueve al punto (x. , y) (denotado como Sxy), por simplicidad, los elementos estructurales son 3x3 y son todos unos. Dentro de esta restricción, son las operaciones lógicas las que determinan la salida.

(2) Operaciones lógicas sobre imágenes binarias

Aunque las operaciones lógicas son simples, son un poderoso complemento para implementar algoritmos de procesamiento de imágenes basados ​​en morfología. Las principales operaciones lógicas utilizadas en el procesamiento de imágenes son: y, o, no (complementarias), que pueden combinarse entre sí para formar otras operaciones lógicas.

(3) Dilatación y erosión

La dilatación y la erosión son la base del procesamiento morfológico, y muchos algoritmos morfológicos se basan en estas dos operaciones.

① Extensión

Basado en obtener la imagen de B relativa a su propio origen y mover la imagen en z. Podemos reescribir la ecuación anterior de la siguiente manera:

El elemento estructural B puede considerarse como una plantilla de convolución. La diferencia es que la expansión se basa en operaciones de conjuntos y la convolución se basa en operaciones aritméticas, pero los dos procesos son similares.

(1) Utilice el elemento estructural B para escanear cada píxel de la imagen A

(2) Utilice el elemento estructural y su imagen binaria superpuesta para realizar la operación "Y"

(3) Si ambos son 0, el resultado de la imagen de píxeles es 0. De lo contrario, es 1

②Corrosión

Para los conjuntos A y B en Z, todo el proceso de corrosión de A por B es el siguiente:

( 1) Utilice los elementos estructurales B escanea cada píxel de la imagen A

(2) Realice una operación "Y" en los elementos estructurales y sus imágenes binarias superpuestas

(3) Si son ambos 1, entonces Los píxeles de la imagen generada son 1, de lo contrario son 0

El resultado del proceso de erosión es reducir la imagen binaria original en un círculo.

(4) Acertar (coincidir) o fallar la transformación

Supongamos que el conjunto A es un conjunto compuesto por tres subconjuntos: X, Y y Z. El conjunto de posiciones exactas de montaje es la intersección de la corrosión de A por . Podemos hacer B = (B1, B2), donde B1 = X, B2 = (W-X), es decir, la coincidencia de B en A y la coincidencia de B en A se puede expresar como:

A⊙B

A esto lo llamamos transformación morfológica de acierto o error.

(5) Adelgazamiento

El adelgazamiento de imágenes se suele utilizar como técnica de preprocesamiento de imágenes para extraer el esqueleto de la imagen de origen, es decir, eliminar las líneas de la imagen original que están más ancho que un píxel. Se reduce a líneas de solo un píxel de ancho, formando un "esqueleto" que facilita el análisis de la imagen, como la extracción de sus características.

La idea básica del adelgazamiento es "privación capa por capa", es decir, comenzando desde el borde de la línea, capa por capa, hasta que solo quede un píxel en la línea. El adelgazamiento de la imagen comprime en gran medida el volumen de datos de la imagen original y mantiene sin cambios su forma topológica básica, sentando así las bases para la extracción de características en aplicaciones de reconocimiento de texto.

El algoritmo de adelgazamiento debe cumplir las siguientes condiciones:

① Convertir el área de la barra en una línea delgada

② La línea delgada debe ubicarse en el centro del área de la barra original; /p>

③Las líneas finas deben mantener las características topológicas de la imagen original.

El refinamiento se divide en refinamiento en serie y refinamiento en paralelo. El refinamiento en serie consiste en detectar puntos que cumplen las condiciones de refinamiento y eliminar los puntos de refinamiento al mismo tiempo. , marque solo puntos y elimine los puntos que deben refinarse de una vez después de detectar la imagen completa.

Los algoritmos de adelgazamiento de imágenes más utilizados incluyen el algoritmo de Hilditch, el algoritmo de Pavlidis y el algoritmo de Rosenfeld.

Nota: Antes de utilizar el algoritmo de adelgazamiento, la imagen debe estar binarizada, es decir, la imagen solo contiene dos colores: "negro" y "blanco".

Las palabras clave son morfología matemática,