Investigación e implementación de métodos de análisis visual espacial basados en datos de pozo: visualización de datos espaciales
Resumen: Este artículo comienza con el análisis espacial de los datos de pozo, estudia principalmente la implementación del modelo de minería de datos espaciales y propone una estructura de modelo de minería de datos espaciales adecuada para la gestión y el análisis de datos de pozo. A través de dos métodos de análisis espacial, análisis de tendencia de superficie y agrupamiento espacial, se exploró la correlación entre secciones mineralizadas, se analizó cualitativamente la distribución general de los yacimientos y se predijeron y evaluaron los patrones de distribución de los yacimientos.
Palabras clave: datos de perforación; extracción de datos espaciales; análisis de superficie de tendencias; análisis de conglomerados
1 Introducción
Los datos en el campo de perforación son complejos y existen. mediciones cuantitativas existentes. Los datos tienen descripciones de texto cualitativas y tienen diferentes dimensiones y formas. Cómo combinar estos datos que reflejan diferentes características para reflejar las características de los pozos y minas sin redundancia ni fugas siempre ha sido el foco de la interpretación de datos en el campo de la perforación [1]. El tema central de este artículo será cómo extraer la información requerida de una enorme base de datos y transformarla en conocimiento intuitivo a través del análisis espacial y presentarla a los usuarios.
2 Modelo de Minería de Datos Espaciales
Minería de Datos Espaciales (SDM), también conocida como Minería de Datos Espaciales y Descubrimiento de Conocimiento basada en bases de datos espaciales, Se refiere a la extracción de conocimiento implícito, espacial u otro. patrones significativos que interesan a los usuarios a partir de bases de datos espaciales [2]. El proceso de extracción de datos espaciales y descubrimiento de conocimiento generalmente incluye experimentos repetidos, toma de decisiones, diseño y personalización del usuario. Es un proceso en el que se conectan múltiples pasos entre sí y se repite la interacción persona-computadora. Fayyad divide el proceso de descubrimiento de conocimiento en nueve etapas, como se muestra en la Figura 1.
Figura 1 Fases principales de la minería de datos espaciales (SDMKD) [3]
Fig1 fases principales de la minería de datos espaciales
La minería de datos espaciales estudia principalmente la distribución de probabilidad de Patrón de datos, características de agrupamiento y clasificación, características de dependencia entre atributos, etc. Su tarea es descubrir el conocimiento o reglas implícitas en una gran cantidad de información geoespacial. Los principales tipos de conocimiento que se pueden descubrir mediante la minería de datos espaciales incluyen: ⑴ reglas de asociación espacial, es decir, las relaciones de asociación entre objetos espaciales como adyacencia, conexión, generación, inclusión, etc.; ⑵ reglas de agrupación espacial, es decir, la agrupación de objetos espaciales con características similares; ⑶ reglas de características espaciales, es decir, las características universales de uno o varios tipos de objetos espaciales; ⑷ reglas de distinción espacial se refieren a las diferentes características entre múltiples tipos de objetos espaciales que se pueden utilizar; para distinguir objetos [4]. Este artículo propone un modelo de minería de datos basado en datos de pozo.
3 Análisis espacial
El análisis espacial es una tecnología de análisis de datos espaciales basada en la ubicación y las características morfológicas de los objetos geográficos. es extraer y transmitir información espacial. Los métodos de análisis espacial comúnmente utilizados incluyen agrupación espacial, análisis de superficie de tendencia, análisis de red, análisis de ondas, análisis de autocorrelación espacial, etc. Este artículo se centra en dos métodos importantes, el análisis de conglomerado y el análisis de superficie de tendencia, desde la perspectiva de las tareas mineras y los métodos de minería. Métodos analíticos.
3.1 Análisis de tendencia de superficie
La tendencia espacial refleja las principales características de los cambios en los objetos espaciales en áreas espaciales, por lo que ignora las variaciones locales para revelar el patrón general. Describir las tendencias espaciales es un problema muy difícil. En teoría, la media del gradiente espacial se puede utilizar como parámetro para describir las tendencias espaciales, pero como no puede reflejar la tendencia desde una perspectiva espacial, rara vez se utiliza en la práctica. Las superficies de tendencia son una herramienta ideal para revelar los patrones de variación espacial de fenómenos de distribución continua en áreas planas. También son el método principal que se utiliza a menudo en la práctica para describir tendencias espaciales. Después de un procesamiento previo adecuado, la tendencia espacial de los fenómenos de distribución discontinua en áreas planas también se puede describir mediante superficies de tendencia.
El análisis de tendencia de la superficie es adecuado para describir la tendencia espacial de fenómenos de distribución continua en un área plana. Dado que los datos de perforación se distribuyen en un espacio tridimensional, es necesario mapear los datos de perforación tridimensionales. un plano. Este artículo Este valor de proyección se llama espesor de mineralización, y su fórmula de cálculo es:
c = ∑(l * k) * p (l-la longitud de la sección de mineralización, k-la mineralización del grado de sección de mineralización, factor de amplificación p). Después de definir este parámetro, puede representar el valor cuantitativo del contenido mineral de cada pozo de perforación. Utilice este parámetro para realizar análisis de superficie de tendencia y utilice el método de isolíneas en cartografía para visualizar los resultados del análisis, que pueden representar intuitivamente el contenido mineral en. tendencia de distribución corporal del área de estudio.
En la fórmula: C es el índice de ajuste, Zj es el valor de observación en el punto j, es el valor de tendencia en el punto j y es el promedio de todos los valores de observación. Cuando C = 100%, indica que el valor de la tendencia es consistente con el valor real en todos los puntos de observación, pero esta situación es poco común. Cuando C = 75 % o más, los errores de ajuste están todos por debajo del 10 %. En este momento, se puede considerar que el efecto de ajuste de la superficie de tendencia es bueno.
3.2 Análisis de conglomerados
El propósito del agrupamiento espacial es analizar el agrupamiento de objetos espaciales y dividirlos en varios subgrupos (categorías) diferentes. La formación de subgrupos es el resultado del funcionamiento del sistema geográfico, según el cual se pueden revelar ciertos mecanismos geográficos. Para el grupo de puntos discreto Pi (i=1, 2,...,n), podemos obtener un conjunto de datos geométricos (xi, yi, zi) que describen la posición del grupo de puntos, y también podemos tener un conjunto de datos de atributos de variables estadísticas ci =( ci1, ci2,...cim), la agrupación espacial es una agrupación basada en datos geométricos. También se puede realizar un análisis de conglomerados basado en CI. Aunque se puede utilizar el mismo algoritmo, el agrupamiento basado en CI debe considerarse un análisis no espacial [4].
Existe un requisito previo para el análisis de conglomerados espaciales, es decir, el grupo de puntos tiene una cierta tendencia central. Teniendo en cuenta que los datos de perforación se distribuyen uniformemente en el plano xy, pero en el espacio tridimensional, las secciones mineralizadas tienden a concentrarse en la dirección del eje z. En la agrupación real, la uniformidad de la distribución del plano de perforación debe ser. Al mismo tiempo, para superar las deficiencias de la sensibilidad del valor de selección inicial, este artículo realiza ciertas mejoras en el algoritmo de agrupamiento. Al seleccionar el valor inicial, los resultados del análisis de la superficie de tendencia de la cantidad de mineralización se combinan y los puntos extremos obtenidos por el análisis de la superficie de tendencia se utilizan para determinar el centro de agrupamiento inicial del algoritmo K-MEANS. Esto no solo mantiene la convergencia rápida. Las características del algoritmo K-means también hacen que los resultados de agrupación sean más consistentes con la tendencia de distribución real. Los pasos del algoritmo son los siguientes:
1) Con base en los resultados del análisis estadístico de la cantidad de mineralización, encuentre el valor extremo *Sj en el plano de cantidad de mineralización.
2) Fusionar puntos extremos similares *Sj para obtener el centro inicial del grupo Sj.
3) Obtenga el número de grupos k y establezca el umbral de error de iteración emin = 0,00001 (se puede configurar según sea necesario).
4) Según el número de clusters k, inicialice el centro del cluster:
En la fórmula: Nj es el número de muestras incluidas en el j-ésimo dominio de clustering.
Si |C j (t 1) - C j (t) |lt; emin , j = 1, 2,...,k entonces detenga la iteración y la t-ésima iteración es el plan de agrupamiento ; de lo contrario, regrese al Paso 4.
Al realizar un análisis de correlación en secciones mineralizadas a través de este algoritmo, puede consultar los resultados del análisis de la superficie de tendencia y cambiar los parámetros de agrupación para obtener un efecto de agrupación que sea más consistente con el análisis de la superficie de tendencia. Sobre la base del análisis de tendencia de la superficie, la correlación entre varios pozos de perforación se obtuvo mediante un análisis de conglomerados espaciales, que proporcionó conocimientos previos para futuras investigaciones sobre la distribución de yacimientos y la simulación tridimensional de yacimientos.
Mapa Fig3 para la distribución de segmentos mineralizados con agrupamiento de 4
4 Conclusión
Mapa Fig3 para la distribución de segmentos mineralizados con agrupamiento de 4
4 Conclusión
p>
Con base en el modelo de minería de datos propuesto en este artículo, bajo el entorno Windows, se desarrolló un sistema de minería de datos espaciales tridimensional basado en datos de perforación utilizando VC y OPENGL utilizando treinta datos de perforación. Este sistema tiene ciertas capacidades de razonamiento automático para la distribución de yacimientos en el área de estudio, evitando intervenciones manuales innecesarias, ampliando así el alcance de aplicación y las capacidades de desempeño del modelado de datos de perforación. Sin embargo, este método todavía tiene algunas deficiencias, como la severa distorsión y deformación de las estructuras geológicas, pliegues complejos y la mezcla de múltiples estructuras. Es necesario mejorar el efecto de modelado y la necesaria interacción entre humanos y computadoras. no se consideran en el proceso de modelado, diversos datos geológicos, conocimientos expertos y experiencia en ingeniería no se pueden integrar en el proceso de modelado real de manera oportuna. Debido a la alta complejidad e incertidumbre de los fenómenos geológicos, los problemas anteriores se irán resolviendo gradualmente a medida que se profundicen la investigación y la aplicación práctica.
Referencias
[1] Yong Shihe, Hong Youmi. Interpretación integral y procesamiento digital de datos de registro de pozos[M]. Beijing: Petroleum Industry Press, 1982.
p >[2] Liu Yiyong, He Xiong, Li Jinshan, etc. Minería de datos espaciales: convertir datos en conocimiento. Computer World, 2005.8.15.
[3] Wang Jing. e Integración del descubrimiento de conocimientos y visualización geográfica. Boletín de topografía y cartografía, número 12, 2005.
[4] Jujun, Zhang Hong Análisis de métodos de minería de datos espaciales, número 3, 2007.
p>[5] Guo Renzhong. Análisis espacial. Prensa de educación superior, Beijing, 2001.10.
Acerca del autor
Chen Hao (1985-), hombre, industria minera china Escuela de Recursos y Ciencias de la Tierra, Universidad, Candidato a Máster.