Red de conocimiento informático - Espacio del host - Me pregunto qué tan locas son las búsquedas. ¿Cuál es su algoritmo de búsqueda y cuáles son las partes específicas del código?

Me pregunto qué tan locas son las búsquedas. ¿Cuál es su algoritmo de búsqueda y cuáles son las partes específicas del código?

En realidad, este es un problema muy complicado, pero después de analizar las capas, el problema se vuelve mucho más claro.

1. Nutch es un producto semiacabado de producto de búsqueda. Ha completado la función de rastreador web por sí solo y la configuración de parámetros es muy compleja y cuidadosa, además de la función de búsqueda de Lucene. de la plataforma en la nube Hadoop.

2. Para aprender Tasou, debes aprender Lucene. El núcleo de Tasou es Lucene, incluidos enlaces principales como indexación, consulta y clasificación.

3. No he mirado el código específico durante mucho tiempo. Consulte libros como Lucene in Action.