Cómo obtener todas las palabras clave en el archivo de índice de Lucene
1. Archivo de bloque de índice
Este archivo contiene información sobre los bloques de índice en el índice, incluido el nombre y el tamaño de cada bloque de índice. La tabla 2 muestra la estructura de este archivo.
Tabla 2: Estructura de archivos del bloque de índice
2. Archivo de información de dominio
Sabemos que los documentos en el índice constan de uno o más dominios, y este archivo. contiene información sobre los campos en cada bloque de índice. La Tabla 3 muestra la estructura de este archivo.
Tabla 3: Estructura del archivo de información del dominio
3. Archivo de información del elemento del índice
Este es el archivo principal en el archivo de índice, que almacena los valores. de todos los elementos del índice e información relacionada, ordenados por términos del índice. La tabla 4 muestra la estructura de este archivo.
Tabla 4: Estructura del archivo de información de elementos del índice
4. Archivo de frecuencia
Tabla 5: Estructura del archivo de frecuencia
5. Archivo de ubicación
Tabla 6: Estructura del archivo de ubicación
6. Archivo de ubicación
Este archivo contiene la información de ubicación del elemento de índice en cada documento. Úselo para participar en la clasificación de los resultados del índice. La Tabla 6 muestra la estructura de este archivo
Tabla 6: Estructura del archivo de ubicación
Hasta ahora, hemos introducido la estructura del archivo de índice principal en Lucene, esperamos que esto pueda ayudarlo Comprender la estructura de almacenamiento físico de Lucene.
------------------------------------------- -- ----------------------------------------Volver arriba Resumen Muchos conocidos Las organizaciones ya están utilizando Lucene. Por ejemplo, Lucene proporciona capacidades de búsqueda para el sistema de ayuda de Eclipse y OpenCourseWare del MIT.