Se ofrece una recompensa de puntuación alta por una traducción en idioma extranjero del proyecto de graduación del laminador. Debe tener el texto original y el contenido traducido. El texto original está en inglés y requiere 15.000 palabras.
Material original en idioma extranjero
Lucene en acción
Otis Gospodnetic Erik Hatcher
Entendiendo a Lucene
Diferentes personas están luchando contra el mismo problema (sobrecarga de información) utilizando diferentes enfoques. Algunos han estado trabajando en nuevas interfaces de usuario, algunos en agentes inteligentes y otros en el desarrollo de herramientas de búsqueda sofisticadas como Lucene. Antes de pasar a la acción con ejemplos de código más adelante en este capítulo. le daremos una imagen de alto nivel de lo que es Lucene, lo que no es y cómo surgió.
Qué es Lucene
Lucene es un software de alto rendimiento, Biblioteca escalable de recuperación de información (IR) Le permite agregar capacidades de indexación y búsqueda a sus aplicaciones. Lucene es un proyecto maduro, gratuito y de código abierto implementado en Java. Es miembro de la popular familia de proyectos Apache Jakarta, con licencia. Licencia liberal de software Apache. Como tal, Lucene es actualmente, y lo ha sido durante algunos años, la biblioteca Java IR gratuita más popular.
Como pronto descubrirá, Lucene proporciona una API central simple pero poderosa. eso requiere una comprensión mínima de la indexación y búsqueda de texto completo. Solo necesita aprender sobre un puñado de sus clases para comenzar a integrar Lucene en una aplicación. Debido a que Lucene es una biblioteca de Java, no hace suposiciones sobre lo que indexa. y búsquedas, lo que le da una ventaja sobre otras aplicaciones de búsqueda.
Las personas nuevas en Lucene a menudo lo confunden con una
aplicación lista para usar como un programa de búsqueda de archivos, un rastreador web o un motor de búsqueda de sitios web. Eso no es lo que es Lucene: Lucene es una biblioteca de software, un conjunto de herramientas por así decirlo, no una búsqueda con todas las funciones. Se ocupa de la indexación y búsqueda de texto, y hace esas cosas muy bien. Lucene permite que su aplicación maneje reglas comerciales específicas de su dominio problemático mientras oculta la complejidad de la implementación de indexación y búsqueda detrás de una API fácil de usar. Puedes pensar en Lucene como una capa sobre la que se ubican las aplicaciones, como se muestra en la figura 1.5.
Se han creado varias aplicaciones de búsqueda con todas las funciones sobre Lucene, si lo que estás buscando. algo prediseñado o un marco para rastreo, manejo de documentos y búsqueda, consulte la página "powered by" de Lucene Wiki (http://wiki.apache.org/jakarta-lucene/PoweredBy) para conocer muchas opciones: Zilverline, SearchBlox, Nutch, LARM y jSearch, por nombrar algunos, se incluyen estudios de casos de Nutch y SearchBlox en el capítulo 10.
Qué puede hacer Lucene por usted
Lucene le permite agregar indexación y capacidades de búsqueda para sus aplicaciones (estas funciones se describen en la sección 1.3). Lucene puede indexar y hacer que se pueda buscar cualquier dato que pueda convertirse a un formato textual.
Figura 1.5 A. integración típica de aplicaciones con Lucene
Traducción original a un idioma extranjero
Comprensión de Lucene
La gente discute el mismo problema: la sobrecarga de información de diferentes maneras.
Algunos de ellos trabajan en nuevas interfaces de usuario, otros son agentes brillantes y otros trabajan en herramientas de búsqueda como Lucene. Antes de trabajar en el código de muestra en el próximo capítulo, le describiremos en detalle qué es Lucene. no, y cómo hacerlo.
Qué es Lucene
Lucene es una base de datos de recuperación de información (IR) escalable y de alto rendimiento. Ha agregado capacidades de indexación y búsqueda para la aplicación. Lucene es un proyecto maduro, gratuito y de código abierto basado en el lenguaje Java, es una rama del popular proyecto Apache Jakarta y tiene la licencia de software gratuito Apache. Por lo tanto, Lucene se ha convertido en el software de búsqueda Java gratuito más popular durante varios años.
Descubrirá rápidamente que Lucene proporciona una API central que es a la vez simple y potente, y que requiere capacidades de búsqueda e indexación de texto completo. Hay algunas cosas que necesita saber para comenzar a integrar una aplicación Lucene. Dado que Lucene es una base de datos Java, no hace suposiciones sobre la indexación y la búsqueda, lo que le otorga una ventaja sobre otras aplicaciones de búsqueda.
Los recién llegados a Lucene a menudo lo confunden con aplicaciones listas para usar, como un programa de búsqueda de archivos, un rastreador web o un motor de búsqueda de sitios web. Esto no es un Lucene real: Lucene es una biblioteca de software y un conjunto de herramientas, pero no es una aplicación de búsqueda con todas las funciones. Está relacionado con la indexación y búsqueda de texto completo. Lucene permite que sus aplicaciones manejen reglas comerciales relacionadas con el dominio relevante, mientras que detrás de la compleja indexación y ejecución de búsqueda se esconde una API simple y fácil de usar. Puedes pensar en Lucene como una capa de software escrita sobre 1.5.
Una de varias aplicaciones de búsqueda con todas las funciones se ha creado en Lucene. Si está buscando algún paquete central compilado o un marco para extraer y buscar procesamiento de archivos, consulte la página "poweredby" en la wiki de Lucene (http://wiki.apache.org/jakarta-lucene/poweredby) para obtener más información. opciones: zilverline, searchblox, nutch, larm, jsearch, por nombrar algunas. Los estudios de caso de Nutch y Searchblox se incluyen en el Capítulo 10.
Qué puede hacer Lucene por usted
Lucene le permite agregar capacidades de indexación y búsqueda a sus aplicaciones (estas funciones se describen en la Sección 1.3). Lucene puede indexar y buscar cualquier dato que pueda convertirse a formato de texto. Puedes ver esto en la Figura 1.5.