Red de conocimiento informático - Material del sitio web - Todo el mundo utiliza la búsqueda. ¿Quién inventó el motor de búsqueda?

Todo el mundo utiliza la búsqueda. ¿Quién inventó el motor de búsqueda?

Historia del desarrollo de los motores de búsqueda

En los primeros días del desarrollo de Internet, la búsqueda por categorías de sitios web, representada por Yahoo, era muy popular. El directorio de clasificación de sitios web se organiza y mantiene manualmente, seleccionando los mejores sitios web de Internet, describiéndolos brevemente y clasificándolos en diferentes directorios. Cuando los usuarios realizan consultas, hacen clic en las capas para encontrar el sitio web que buscan. Algunas personas también llaman motor de búsqueda a este sitio web de servicio de búsqueda basado en directorio, pero no es un motor de búsqueda en sentido estricto.

En 1990, profesores y estudiantes de la Facultad de Informática de la Universidad McGill de Canadá desarrollaron Archie, un motor de búsqueda para la World Wide Web que aún no había aparecido en aquel momento y que se utilizaba para intercambiar recursos a través de FTP. .

Archie recopila y analiza periódicamente información de nombres de archivos en servidores FTP y proporciona métodos para encontrar información de nombres de archivos en cada host FTP. Proporciona búsqueda separada de archivos en cada host FTP. El usuario debe ingresar el nombre exacto del archivo para buscar y Archie le dirá qué servidor FTP puede descargar el archivo. Aunque los recursos de información recopilados por Archie no son páginas web (archivos HTML), sus métodos de trabajo básicos son los mismos que los de los motores de búsqueda: recopilar automáticamente recursos de información, compilar índices y proporcionar servicios de búsqueda. Por lo tanto, Archie es reconocido como el creador de los motores de búsqueda modernos.

El origen de los motores de búsqueda

El origen de todos los motores de búsqueda es Archie (Archie FAQ), el cual fue creado por tres estudiantes de la Universidad McGill de Montreal (Alan Emtage, Peter Deutsch y Bill Wheelan) Inventado en 1990. Emtage et al. propusieron la idea de desarrollar un sistema para buscar archivos por nombre de archivo. Archie fue el primer programa que indexaba automáticamente archivos en sitios FTP anónimos en Internet, pero Archie aún no era un verdadero motor de búsqueda; buscable Una lista de nombres de archivos FTP, el usuario debe ingresar el nombre exacto del archivo para buscar, y Archie le dirá al usuario qué dirección FTP puede descargar el archivo. Debido a la popularidad de Archie, el Departamento de Servicios de Computación del Sistema de la Universidad de Nevada se inspiró en Archie y desarrolló una herramienta de búsqueda Gopher (Preguntas frecuentes de Gopher) Veronica (Preguntas frecuentes de Veronica) en 1993. Jughead es otra herramienta de búsqueda de Gopher posterior.

El desarrollo de los motores de búsqueda

Desarrollo (1)

La historia de Excite se remonta a febrero de 1993, cuando seis estudiantes universitarios de la Universidad de Stanford surgieron con la idea La idea de analizar las relaciones de significado de las palabras para recuperar de manera más eficiente las grandes cantidades de información en Internet. A mediados de 1993, el proyecto estaba totalmente financiado y lanzaron una versión del software de búsqueda para que los webmasters lo usaran en sus propios sitios, que se conoció como Excite for Web Servers.

Nota: Excite pasó a denominarse búsqueda de conceptos y fue adquirida por Infospace en mayo de 2002. Excite dejó de utilizar su propio motor de búsqueda y pasó al metabuscador Dogpile

Desarrollo (2)

En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford y el chino-estadounidense Yang Zhiyuan y David Philo**** cofundó Yahoo. A medida que aumentaron las visitas y los enlaces incluidos, el Directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Debido a que los datos de Yahoo se ingresan manualmente, en realidad no se pueden clasificar como un motor de búsqueda y en realidad es solo un directorio en el que se pueden realizar búsquedas. Cuando Yahoo incluye sitios web, incluye información de perfil, por lo que la eficiencia de la búsqueda mejora significativamente.

Nota: Después de Yahoo, Altavista, Inktomi y Google también se convirtieron uno tras otro en motores de búsqueda

Yahoo, sinónimo de Internet en los años 90.

Desarrollo (3)

En 1995, apareció una nueva forma de motor de búsqueda: Meta Search Engine.

Los usuarios solo necesitan enviar una solicitud de búsqueda, y el metabuscador es responsable de la conversión y el procesamiento antes de enviarla a una serie de motores de búsqueda independientes preseleccionados, y devuelve todos los resultados de las consultas de los motores de búsqueda independientes y luego los devuelve al usuario después del procesamiento centralizado.

El primer metabuscador fue Metacrawler, co-creado por Eric Selberg y Oren Etzioni, estudiante de maestría en la Universidad de Washington. Era excelente en concepto, pero los resultados de búsqueda nunca fueron ideales, por eso los metabuscadores. Nunca ocupó una posición fuerte.

Desarrollo (4)

La aparición de la recuperación inteligente: utiliza diccionarios de segmentación de palabras, diccionarios de sinónimos y diccionarios homófonos para mejorar los resultados de la recuperación. Puede ayudar aún más a las consultas a nivel de conocimiento. o nivel de concepto, a través del procesamiento de recuperación de diccionarios temáticos, diccionarios superiores y subordinados y diccionarios relacionados forma un sistema de conocimiento o red de conceptos, brindando a los usuarios consejos de conocimiento inteligentes y, en última instancia, ayudando a los usuarios a obtener los mejores resultados de recuperación. Obtenga los mejores resultados de búsqueda.

Ejemplo:

(1) Consulta "computadora" y también puedes recuperar información relacionada con "computadora";

(2) Puedes restringir aún más la consulta Alcance, consulta "microcomputadora", "servidor", "computadora", "servidor" o ampliar la consulta a "tecnologías de la información" o consulta con "tecnología electrónica", "software", "software", "computadora", " También se puede recuperar "información relacionada con la computadora. Software", "aplicaciones informáticas" y otras categorías;

(3) también incluye información difusa y procesamiento de recuperación, como "manzana", ya sea que se refiera a frutas o La marca de computadora, "Chino" y "República Popular China" se procesarán mediante una combinación de base de datos de descripción de conocimiento de desambiguación, indexación de texto completo, análisis de contexto de búsqueda de usuario y comentarios de relevancia del usuario para transmitir de manera eficiente y precisa la información más necesaria a los usuarios.

Desarrollo (5)

La tendencia a la personalización es una de las características importantes y tendencias inevitables del desarrollo futuro de los motores de búsqueda. Una forma es organizar la información personal a través de los productos comunitarios del motor de búsqueda (es decir, brindar servicios a usuarios registrados) y luego introducir la recuperación de factores personales en la base de datos de información básica del motor de búsqueda para su análisis y obtener diferentes resultados de búsqueda para individuos. Desde que Yahoo lanzó la versión beta de myweb en octubre de 2004 y a9 lanzó la función de personalización en noviembre de 2005, el proceso de desarrollo de la búsqueda de Google ha sido básicamente completo, analizando las necesidades de búsqueda de usuarios específicos para limitar el alcance de la búsqueda y luego de acuerdo con a las necesidades del usuario El alcance se extiende a otros sitios web similares en Internet, dando los resultados más relevantes. Pero no importa cuál de estas implementaciones, es decir, Google selecciona activamente el alcance de la búsqueda, o Yahoo y Vivisimo reorganizan la información que necesitan en los resultados, es solo un intento o una idea, y es imposible convertirse en un motor de búsqueda en el corto plazo.

Desarrollo (6)

Tecnología de red (cuadrícula global): dado que no existe un estándar de organización de información unificada para manejar los recursos de información de la red, los recursos de información de red desordenados son difíciles de recuperar e intercambiar. compartir e incluso desarrollar y utilizar en profundidad, formando islas de información. La tecnología Grid tiene como objetivo eliminar las islas de información y lograr una conectividad integral de todos los recursos de Internet.

National Global Information Grid (Global Information Grid)

La palabra robot tiene un significado especial para los programadores. Un robot informático es un programa automático que puede realizar una tarea repetidamente a una velocidad inalcanzable. . Los robots de los motores de búsqueda se llaman arañas porque están diseñados específicamente para recuperar información y se arrastran por la web como una araña.

En 1993, Matthew Gray desarrolló el primer programa "robot", World Wide Web Wanderer, que utilizaba enlaces entre páginas web HTML para detectar el tamaño de la World Wide Web. Inicialmente solo se usaba para contar el número de servidores en Internet, pero luego también pudo capturar direcciones web (URL).

En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, los chino-estadounidenses Jerry Yang y David Philo****, cofundaron Yahoo con el aumento del número de visitantes y de enlaces que contenía, As it. creció, el directorio comenzó a admitir búsquedas simples en bases de datos. Debido a que los datos de Yahoo se ingresan manualmente, en realidad no se pueden clasificar como un motor de búsqueda y en realidad es solo un directorio en el que se pueden realizar búsquedas.

Yahoo adquirió inktomi el 23 de diciembre de 2002, Overture (incluidos Fast y Altavista) el 14 de julio de 2003 y adquirió por completo 3721 Corporation en noviembre de 2003.

A principios de 1994, Brian Pinkerton, un estudiante de la Universidad de Washington, inició su pequeño proyecto: WebCrawler. El proyecto se lanzó oficialmente el 20 de abril de 1994 y solo contenía contenido de 6.000 servidores. WebCrawler es el primer motor de búsqueda de texto completo en Internet que admite la búsqueda del texto completo de los documentos. Antes de esto, los usuarios solo podían buscar por URL y resumen, que generalmente provenía de anotaciones manuales o de un programa que obtenía automáticamente las primeras 100 palabras; el texto.

En julio de 1994, Michael Mauldin de la Universidad Carnegie Mellon integró el programa araña de John Leavitt en su programa de indexación y creó Lycos. Además de la clasificación por relevancia, Lycos también proporciona coincidencias de prefijos y restricciones de caracteres. Lycos es el primer motor de búsqueda que utiliza el resumen automático de páginas web en los resultados de búsqueda. Su mayor ventaja es que la cantidad de datos supera con creces a otros motores de búsqueda.

A finales de 1994 se lanzó oficialmente Infoseek. Su interfaz fácil de usar y toneladas de funciones adicionales lo convierten en un motor de búsqueda tan importante como Lycos.

En 1995, apareció una nueva forma de motor de búsqueda: una revisión de los metabuscadores. Los usuarios solo necesitan enviar una solicitud de búsqueda, y el metabuscador es responsable del proceso de conversión, enviándolo a una serie de motores de búsqueda independientes preseleccionados y devolviendo todos los resultados de las consultas de los motores de búsqueda independientes, y luego devolviéndolos al usuario después del procesamiento centralizado. El primer metabuscador, Metacrawler, fue desarrollado por Eric Selberg y Oren Etzioni, estudiantes de maestría de la Universidad de Washington.

En diciembre de 1995, DEC lanzó oficialmente AltaVista, que fue el primer motor de búsqueda que admitía búsquedas en lenguaje natural y el primer motor de búsqueda en implementar sintaxis de búsqueda avanzada (como A, B y C). Los usuarios pueden utilizar AltaVista para buscar contenidos de grupos de noticias, recuperar artículos de Internet, buscar texto dentro de nombres de imágenes, buscar títulos, buscar subprogramas Java y buscar objetos ActiveX. AltaVista también afirma ser el primer motor de búsqueda que admite el envío o eliminación de URL por parte de los propios usuarios a bibliotecas de índices de red, así como el envío o eliminación de URL a bibliotecas de índices de red. AltaVista también afirma ser el primer motor de búsqueda que permite a los usuarios enviar o eliminar URL a la biblioteca de índice web ellos mismos y estar en línea dentro de las 24 horas. Una de las nuevas características más interesantes de AltaVista es la capacidad de buscar todos los sitios web que tienen enlaces a una URL. AltaVista también realizó algunos cambios en su interfaz de usuario. Coloca "consejos" debajo del área del cuadro de búsqueda para ayudar a los usuarios a expresar mejor sus búsquedas, y estos consejos se actualizan con frecuencia para que después de algunas búsquedas, los usuarios vean muchas funciones interesantes que quizás nunca hayan conocido. Esta serie de funciones fueron adoptadas gradualmente por otros motores de búsqueda. En 1997, AltaVista lanzó el sistema de visualización gráfica LiveTopics para ayudar a los usuarios a encontrar lo que buscan entre miles de resultados de búsqueda.

El 26 de septiembre de 1995, Eric Brewer, profesor asistente de la Universidad de California, Berkeley, y Paul Gaudier, estudiante de doctorado, fundaron Inktomi y lo registraron el 20 de mayo de 1996. El poderoso HotBot apareció frente al mundo. HotBot afirma rastrear su índice de más de 10 millones de páginas por día y, por lo tanto, tiene mucho más contenido nuevo que cualquier otro motor de búsqueda, y también hace un uso extensivo de cookies para almacenar las preferencias de búsqueda personales de los usuarios.

En agosto de 1997 se lanzó el motor de búsqueda Northernlight.

Tiene una de las bases de datos más grandes de cualquier motor de búsqueda, sin palabras vacías, excelentes noticias de actualidad, colecciones especiales de más de 7.100 publicaciones, buena sintaxis de búsqueda avanzada y es el primero en admitir la clasificación automática simple de los resultados de búsqueda del motor de búsqueda.

Antes de octubre de 1998, Google era sólo BackRub, un pequeño proyecto de la Universidad de Stanford. En 1995, el estudiante de doctorado Larry Page comenzó a estudiar diseño de motores de búsqueda y registró el nombre de dominio el 15 de septiembre de 1997. A finales de 1997, a través de Sergey Brin, Scott Hassan y Alan Strindberg. Con la participación de Bahruub, **** comenzó a ofrecer demostraciones. En febrero de 1999, Google completó su transformación de Alfa a Beta. Google celebra el 27 de septiembre de 1998 como su cumpleaños. Google utiliza el ranking de la página (Pagerank) como base para juzgar la importancia de una página web, lo que mejora enormemente la relevancia de los resultados de búsqueda. La cultura geek de Google y su filosofía de "No seas malvado" le han valido a Google una gran reputación y reputación de marca. En abril de 2006, Google anunció que su nombre chino sería "Google". En abril de 2006, Google anunció el nombre chino "Google", que fue el primer nombre chino de Google en un país de habla no inglesa.

Fast (Alltheweb) se fundó en 1997 como subproducto de una investigación académica en la Universidad Noruega de Ciencia y Tecnología (NTNU) y lanzó su propio motor de búsqueda AllTheWeb en mayo de 1999. La búsqueda web de Fast (Alltheweb) puede utilizar ODP para clasificar automáticamente, admitir búsquedas en Flash y PDF, admitir búsquedas en varios idiomas y también proporcionar búsqueda de noticias, búsqueda de imágenes, videos, MP3 y FTP, con funciones de búsqueda avanzadas extremadamente potentes. (Overture adquirió la división de búsqueda en Internet de Fast el 25 de febrero de 2003).

Sohu se fundó en agosto de 1996. Produce principalmente directorios clasificados de sitios web chinos. Alguna vez tuvo la reputación de "buscar mapas cuando salías y buscar Sohu en línea". Con el rápido aumento del número de sitios de Internet, este directorio de categorías editado manualmente ya no es adecuado. Sohu lanzó de forma independiente el sitio web de búsqueda de nombres de dominio "Sogou" en agosto de 2004, autodenominado "motor de búsqueda de tercera generación".

Openfind se fundó en enero de 1998. Su tecnología se originó en el laboratorio GAIS dirigido por el profesor Wu Sheng de la Universidad Nacional Chung Cheng en Taiwán. Openfind comenzó como un motor de búsqueda chino únicamente. En su apogeo, también proporcionó motores de búsqueda chinos para los tres famosos portales Sina, Qimo y Yahoo. Sin embargo, después del año 2000, el mercado se dividió gradualmente entre Baidu y Google. En junio de 2002, Openfind relanzó la versión beta del motor de búsqueda Openfind basado en el proyecto GAIS30, lanzó PolyRankTM y anunció que había rastreado un total de 3.500 millones de páginas web y comenzó a ingresar al campo de la búsqueda en inglés.

En enero de 2000, dos ex alumnos de la Universidad de Pekín, Robin Li, el inventor de la patente de análisis de hipervínculos y ex ingeniero senior de Infoseek, y su amigo Xu Yong, becario postdoctoral en la Universidad de California, Berkeley, Fundó Baidu en Zhongguancun, Beijing, y lanzó la versión beta del motor de búsqueda Baidu en agosto de 2001 (anteriormente, Baidu solo proporcionaba motores de búsqueda para otros portales como Sohu y Sina Tom). En octubre de 2001 lanzaron un motor de búsqueda basado en el proyecto GAIS30. En agosto de 2001, Baidu lanzó la versión beta de su motor de búsqueda (anteriormente Baidu sólo proporcionaba motores de búsqueda para otros portales como Sohu, Sina, Tom, etc.).

Otras características del motor de búsqueda Baidu incluyen:

Después del lanzamiento del proyecto Blitzen en marzo de 2002, la velocidad de actualización de la tecnología de Baidu se aceleró significativamente.

Después de lanzar una serie de productos como Tieba, Zhizhi, mapas, estudios chinos, enciclopedias, documentos, videos y blogs, fueron muy populares entre los internautas. El 5 de agosto de 2005, la empresa cotizó en NASDAQ en los Estados Unidos. un precio de emisión de 27,00 dólares estadounidenses. El código de acciones BIDU abrió a 66,00 dólares estadounidenses y cerró a 122,54 dólares estadounidenses, un aumento del 353,85%, estableciendo un récord para el mayor aumento en el mercado de valores de EE. UU. el día de la cotización en los últimos cinco años. Estableció un récord del mayor aumento diario en el número de nuevas acciones cotizadas en el mercado de valores estadounidense en cinco años.

El 23 de diciembre de 2003, HC Search original operó oficialmente de forma independiente y se estableció China Search.

En febrero de 2004, China Search lanzó el motor de búsqueda de escritorio WebPig 1.0. En marzo de 2006, China Search cambió el nombre de WebPig a IG (Internet Gateway).

En junio de 2005, Sina lanzó oficialmente su motor de búsqueda de desarrollo propio "Aiwen". Desde 2007, Sina iAsk ha comenzado a utilizar el motor de búsqueda de Google.

1 de julio de 2007: Sina iAsk adoptó la tecnología de búsqueda desarrollada independientemente por NetEase para fusionar la búsqueda integral original y la búsqueda web. La búsqueda web, la búsqueda de imágenes y la búsqueda de blogs de Youdao brindan servicios para la búsqueda NetEase. La búsqueda web utiliza tecnología de procesamiento de lenguaje natural de desarrollo propio, tecnología de almacenamiento distribuido y tecnología informática de búsqueda, que es la primera en proporcionar funciones de búsqueda avanzadas basadas en marcas de cámaras, modelos e incluso temporadas, y tiene capacidades completas y actualizadas en comparación con productos similares; Ventaja oportuna, que proporciona "vista previa del artículo", "archivo de blog", "artículo de blog", "publicación de blog", "archivo de blog" y otras funciones. En comparación con productos similares, la búsqueda y el rastreo de blogs son más completos, se actualizan más oportunamente y proporcionan funciones innovadoras como "vista previa de artículos" y "archivo de blogs".