Red de conocimiento informático - Problemas con los teléfonos móviles - ¿Cuáles son las funciones de los componentes de Solr?

¿Cuáles son las funciones de los componentes de Solr?

Solr es un servidor de búsqueda de código abierto basado en Lucene Java que es fácil de agregar a las aplicaciones web.

2. Solr proporciona búsqueda de primer nivel (es decir, estadísticas), resaltado de visitas y soporte para múltiples formatos de salida (incluidos los formatos XML/XSLT y JSON). Es fácil de instalar y configurar y viene con una interfaz de administración

basada en HTTP. Solr se ha utilizado en muchos sitios web grandes y es relativamente maduro y estable.

3. Solr empaqueta y extiende Lucene, por lo que Solr básicamente sigue la terminología de Lucene. Además, los índices creados por Solr son totalmente compatibles con la biblioteca del motor de búsqueda Lucene.

Cuarto: con la configuración adecuada de Solr, Solr puede leer y usar índices integrados en otras aplicaciones de Lucene, que pueden requerir codificación en algunos casos.

5. Además, muchas herramientas de Lucene (como Nutch, Luke) también pueden utilizar índices creados por Solr. Puede utilizar la funcionalidad de búsqueda básica de alto rendimiento de Solr o ampliarla para satisfacer las necesidades de su organización.

Ventajas de Solr

A través de la introducción anterior a Solr, podemos ver que las ventajas de Solr incluyen los siguientes puntos:

① Búsqueda avanzada de texto completo función ;

② Optimizado para tráfico de red de alto rendimiento

③ Basado en estándares de interfaz abiertos (XML y HTTP

④ Interfaz de gestión HTML integral;

⑤ Interfaz de gestión HTML completa;

Interfaz de gestión HTML completa. Interfaz de administración HTML integrada;

⑤ Escalabilidad: se puede copiar de manera eficiente a otro servidor de búsqueda Solr;

⑥ Flexibilidad y adaptabilidad usando la configuración XML;

p>

⑦ Sistema enchufable extensible.

solr VS Lucene!

Antes de comparar solr y Lucene, es muy importante comprender qué es Lucene, así que primero revisemos qué es Lucene.

Lucene es un conjunto de herramientas de recuperación de información de texto completo basado en Java. No es una aplicación de búsqueda completa, pero proporciona capacidades de indexación y búsqueda para su aplicación. Lucene es actualmente un proyecto de código abierto de la familia Apache Jakarta. También es actualmente el kit de herramientas de búsqueda de texto completo de código abierto basado en Java más popular. Ya existen muchas aplicaciones cuyas funciones de búsqueda se basan en Lucene, como la función de búsqueda del sistema de ayuda de Eclipse. Lucene puede indexar datos de tipo texto, por lo que simplemente convierte el formato de datos que desea indexar a formato de texto y Lucene indexa sus documentos y los hace aptos para búsquedas.

Entonces, ¿Solr es un "perdedor" en comparación?

Solr es una gran herramienta para buscar documentos en Lucene.

De hecho, Solr y Lucene no compiten entre sí. Por el contrario, Solr depende de Lucene, porque la tecnología central subyacente de Solr se implementa utilizando Lucene. los siguientes tres puntos: Servidor de búsqueda, Empresa y Gestión. Lucene es esencialmente una biblioteca de búsqueda, no una aplicación independiente, mientras que Solr sí lo es. Lucene es esencialmente una biblioteca de búsqueda, no una aplicación independiente, mientras que Solr sí lo es.

Lucene se centra en la estructura de búsqueda subyacente, mientras que Solr se centra en las aplicaciones empresariales. Lucene no es responsable de la gestión necesaria para soportar el servicio de búsqueda, Solr sí lo es. Por lo tanto, Solr se puede resumir de la siguiente manera: Solr es una extensión de Lucene para aplicaciones de búsqueda empresarial.

El siguiente es el diagrama de arquitectura de Solr y Lucene:

Este diagrama es muy tedioso de entender, pero no se desanime a través del siguiente código, podrá hacerlo. para comprender el contenido del diagrama.

Es fácil ver que el verde es el módulo lucene y el azul es la extensión solr lucene. En la figura se puede ver lo siguiente:

a. ¿Un verdadero campo dinámico (campo dinámico) y una clave única (clave única) y un esquema de datos (esquema de datos)?

b. ¡Potente extensión del lenguaje de consulta Lucene!

c. ¿Admite agrupación dinámica y filtrado de resultados?

d. ¿Análisis de texto avanzado configurable?

e. ¿Mecanismo de almacenamiento en caché altamente configurable y escalable?

¿Optimización del rendimiento?

g.¿Admite configuración externa mediante XML?

h. ¿Existe una interfaz de gestión?

i. ¿Se pueden monitorear los registros?

j. Admite actualizaciones incrementales rápidas y distribución de instantáneas

Dicho esto, la introducción a Solr termina aquí. Creo que todos ya están familiarizados con Solr. Con una comprensión preliminar, comencemos. ¿Cuáles son los atributos comunes de Solr?

Propiedades y archivos de configuración utilizados por Solr

Un documento consta de uno o más campos. Los campos constan de un nombre, contenido y metadatos que le dicen a Solr qué hacer con el contenido.

Por ejemplo, un campo puede contener cadenas, números, valores booleanos o fechas, o cualquier tipo que desee agregar, simplemente configúrelo en consecuencia en el archivo de configuración de Solr.

Los campos se pueden describir utilizando una serie de opciones que le indican a Solr cómo manejar el contenido durante la indexación y la búsqueda.

Ahora, eche un vistazo a un subconjunto de las propiedades importantes enumeradas en la imagen a continuación:

Sería bueno mencionar aquí un archivo importante de Solr, la configuración esquema.xml. archivo.

(a) esquema.xml

El archivo de configuración esquema.xml se puede encontrar en el directorio (\solr\example\solr\collection1\conf) en el directorio de instalación donde descargué el paquete de software solr. Se encuentra en , es el archivo asociado con el esquema solr.

Abra el archivo de configuración y verá comentarios detallados. La organización del patrón se divide principalmente en tres configuraciones importantes:

1. Tipo de campo

Tipo de campo: es decir, el significado del tipo de atributo, como int, String y Boolean. esta configuración En el archivo, FieldType tiene una función para definir atributos. Consulte la imagen a continuación:

La imagen muestra los familiares int, String y Boolean, entonces, ¿cuál es la configuración detrás de esto? Luego, introduzcamos los siguientes parámetros:

2. Campo

Campo: es el nombre del atributo agregado al archivo de índice y la declaración de tipo debe usar el tipo anterior, como se muestra en la figura:

ps: campo: configuración de campo fijo; ②dynamicField: configuración de campo dinámico, utilizado para campos personalizados posteriores. Para campos personalizados posteriores, * es un carácter comodín. Por ejemplo: test_i es un campo dinámico de tipo int.

También hay un campo especial copyField, que generalmente se usa para recuperar campos. De esta manera, si hay varias fuentes, solo necesita colocar el índice de este campo en la fila del campo de destino. de copyField. Debe estar configurado