Fondo generado por el motor de búsqueda
En los primeros días del desarrollo de Internet, las consultas de directorios de categorías de sitios web representadas por Yahoo eran muy populares. El directorio de clasificación de sitios web se organiza y mantiene manualmente. Los sitios web excelentes en Internet se seleccionan, describen brevemente y clasifican en diferentes directorios. Cuando los usuarios realizan consultas, hacen clic en las capas para encontrar el sitio web que desean encontrar. Algunas personas también llaman motor de búsqueda a este sitio web de servicio de recuperación basado en directorio, pero estrictamente hablando, no es un motor de búsqueda.
En 1990, profesores y estudiantes de la Facultad de Ciencias de la Computación de la Universidad de McGill en Canadá desarrollaron Archie. En ese momento, la World Wide Web aún no había aparecido y la gente compartía e intercambiaba recursos a través de FTP. Archie puede recopilar y analizar periódicamente información de nombres de archivos en el servidor FTP y brindar la capacidad de buscar archivos en cada host FTP. El usuario debe ingresar el nombre exacto del archivo para buscar y Archie le dice qué servidor FTP puede descargar el archivo. Aunque los recursos de información recopilados por Archie no son páginas web (archivos HTML), el método de trabajo básico de Archie es el mismo que el de los motores de búsqueda: recopilar automáticamente recursos de información, establecer índices y proporcionar servicios de recuperación. Por lo tanto, Archie es reconocido como el creador de los motores de búsqueda modernos.
Origen
El antepasado de todos los motores de búsqueda fue Archie (Archie FAQ) inventado en 1990 por tres estudiantes de la Universidad McGill de Montreal (Alan Emtage, Peter Deutsch y Bill Wheelan). Alan Emtage y otros pensaron en desarrollar un sistema que pudiera buscar archivos por nombre, así nació Archie. Archie fue el primer programa que indexó automáticamente los archivos de sitios web FTP anónimos en Internet, pero aún no era un verdadero motor de búsqueda. Archie es una lista de búsqueda de nombres de archivos FTP. El usuario debe ingresar el nombre exacto del archivo a buscar y Archie le indicará qué dirección FTP puede descargar el archivo. Inspirados por la popularidad de Archie, los Servicios de Computación del Sistema de la Universidad de Nevada desarrollaron una herramienta de búsqueda Gopher (Preguntas frecuentes de Gopher) Veronica (Preguntas frecuentes de Veronica) en 1993. Jughead es otra herramienta de búsqueda de Gopher posterior.
Desarrollo (1)
La historia de Excite se remonta a febrero de 1993. La idea de seis estudiantes universitarios de la Universidad de Stanford era analizar la relación entre palabras para analizar la Relación entre palabras en Internet. Buscar grandes cantidades de información de forma más eficiente. A mediados de 1993, era un proyecto totalmente financiado y lanzaron una versión del software de búsqueda para que los webmasters lo usaran en sus propios sitios, más tarde llamado Excite for Web Servers.
Nota: Excite se hizo famoso más tarde por su concepto de búsqueda. En mayo de 2002, Excite, que fue adquirida por Infospace, detuvo su propio motor de búsqueda y cambió al metabuscador Dogpile.
Desarrollo (2)
En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, los estadounidenses de origen chino Jerry Yang y David Filo***, cofundaron Yahoo! . A medida que crecía el número de visitas y los enlaces incluidos, el directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Debido a que los datos de Yahoo! se ingresan manualmente, en realidad no se puede clasificar como un motor de búsqueda y, de hecho, es solo un directorio en el que se pueden realizar búsquedas. Dado que todos los sitios web incluidos en Yahoo! van acompañados de información breve, la eficiencia de la búsqueda mejora significativamente.
Nota: A Yahoo le seguirán Altavista, Inktomi y Google para proporcionar servicios de motores de búsqueda.
Yahoo!, casi se convirtió en sinónimo de Internet en la década de 1990.
Desarrollo (3)
En 1995, apareció una nueva forma de motor de búsqueda: Meta Search Engine. Los usuarios solo necesitan enviar una solicitud de búsqueda una vez, y el metabuscador es responsable de la conversión y el procesamiento antes de enviarla a múltiples motores de búsqueda independientes preseleccionados. Todos los resultados de la consulta devueltos por cada motor de búsqueda independiente se centralizarán y procesarán antes de regresar a ellos. el usuario.
El primer metabuscador fue Metacrawler, de Eric Selberg y Oren Etzioni, estudiantes de máster de la Universidad de Washington. El concepto de metabuscador suena muy bien, pero los resultados de búsqueda nunca son ideales, por lo que ningún metabuscador ha tenido nunca una posición sólida.
Desarrollo (4)
La aparición de la recuperación inteligente: utiliza diccionarios de segmentación de palabras, diccionarios de sinónimos y diccionarios homófonos para mejorar los resultados de la recuperación y puede ayudar aún más a nivel de conocimiento o Consulta a nivel conceptual, a través del proceso de recuperación del diccionario de materias, el léxico superior e inferior y los diccionarios hermanos relacionados, se forma un sistema de conocimiento o red de conceptos, que brinda a los usuarios consejos de conocimiento inteligentes y, en última instancia, ayuda a los usuarios a obtener los mejores resultados de recuperación.
Ejemplo:
(1) Consulta "computadora" y también se puede recuperar información relacionada con "computadora";
(2) Puedes restringir aún más la consulta El alcance se extiende a "microcomputadora", "servidor" o la consulta se expande a "tecnología de la información" o "tecnología electrónica", "software", "aplicación informática" y otras categorías relacionadas;
(3) También incluye ambigüedad en el procesamiento de información y recuperación, como "Apple", ¿se refiere a una fruta o a una marca de computadora? La distinción entre "chino" y "La República Popular China" se realizará a través de la descripción del conocimiento de ambigüedad. La base de datos, el índice de texto completo, el análisis del contexto de búsqueda del usuario y la retroalimentación de relevancia del usuario y otras tecnologías se combinan para transmitir de manera eficiente y precisa la información que los usuarios más necesitan.
Desarrollo (5)
La tendencia a la personalización es una característica importante y una de las tendencias inevitables en el desarrollo futuro de los motores de búsqueda. Una forma es organizar la información personal a través de los productos comunitarios del motor de búsqueda (es decir, proporcionar servicios a usuarios registrados) y luego introducir factores personales en la recuperación de la base de datos de información básica del motor de búsqueda para su análisis y obtener diferentes resultados de búsqueda para individuos. Desde que Yahoo lanzó la versión beta de myweb en octubre de 2004 y a9 lanzó la función de personalización en noviembre de 2005, el historial de búsqueda de Google ha seguido básicamente el mismo camino: analiza las necesidades de búsqueda de usuarios específicos para limitar el alcance y luego se expande según las necesidades del usuario. Otros sitios web similares en Internet dan los resultados más relevantes. El otro es para las masas, el motor de búsqueda personalizado Google, o yahooMindSet, o vivisimo, que todos conocemos como clustering front-end. Sin embargo, no importa qué método de implementación se utilice, es decir, la selección activa del rango de búsqueda por parte de Google, o la reorganización de la información que necesitan en los resultados por parte de Yahoo y Vivisimo, es un experimento o una idea, y no se convertirá en una búsqueda convencional. productos de aplicación del motor en el corto plazo.
Desarrollo (6)
Tecnología de red (gran red global): dado que no existe un estándar de organización de información unificada para procesar recursos de información de red, es difícil procesar recursos de información de red desordenados. Realice la recuperación, la transferencia, el intercambio e incluso el desarrollo y utilización en profundidad para formar una isla de información. La tecnología Grid tiene como objetivo eliminar las islas de información y lograr una conectividad integral de todos los recursos en Internet.
National Global Information Grid (Global Information Grid)
La palabra Robot tiene un significado especial para los programadores. Computer Robot se refiere a un programa automático que puede realizar repetidamente una tarea a una velocidad que los humanos no pueden alcanzar. Debido a que los programas de robots diseñados para recuperar información se arrastran por Internet como arañas, los programas de robots de los motores de búsqueda se denominan programas de araña.
En 1993, Matthew Gray desarrolló World Wide Web Wanderer, que fue el primer programa "robot" que utilizó las relaciones de enlace entre páginas web HTML para detectar el tamaño de la World Wide Web. Al principio solo se usaba para contar el número de servidores en Internet y luego también pudo capturar direcciones web (URL).
En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, los chino-estadounidenses Jerry Yang y David Filo***, cofundaron Yahoo. A medida que crecía el número de visitas y los enlaces incluidos, el directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Porque Yahoo! Los datos se ingresan manualmente, por lo que en realidad no se pueden clasificar como un motor de búsqueda y, de hecho, es solo un directorio en el que se pueden realizar búsquedas. Yahoo adquirió inktomi el 23 de diciembre de 2002 y Overture, incluidas Fast y Altavista, el 14 de julio de 2003. En noviembre de 2003, Yahoo adquirió por completo 3721 Company.
A principios de 1994, Brian Pinkerton, un estudiante de la Universidad de Washington, inició su pequeño proyecto WebCrawler. Cuando WebCrawler se lanzó oficialmente el 20 de abril de 1994, contenía contenido de sólo 6.000 servidores. WebCrawler es el primer motor de búsqueda de texto completo en Internet que admite la búsqueda en el texto completo de un archivo. Antes, los usuarios solo podían buscar por URL y resumen. El resumen generalmente provenía de comentarios manuales o de las primeras 100 palabras del texto de forma automática. recuperado por un programa.
En julio de 1994, Michael Mauldin de la Universidad Carnegie Mellon conectó el programa araña de John Leavitt a su programa de indexación y creó Lycos. Además de la clasificación por relevancia, Lycos también proporciona restricciones de coincidencia de prefijos y similitud de caracteres. Lycos fue el primero en utilizar un resumen automático de páginas web en los resultados de búsqueda, y su mayor ventaja es que supera con creces la cantidad de datos de otros motores de búsqueda.
A finales de 1994, Infoseek debutó oficialmente. Su amigable interfaz y su gran cantidad de funciones adicionales lo convierten en un importante representante de motores de búsqueda como Lycos.
En 1995, apareció una nueva forma de motor de búsqueda: un metamotor de búsqueda (A Meta Search Engine Roundup). Los usuarios solo necesitan enviar una solicitud de búsqueda una vez, y el metabuscador es responsable del procesamiento de la conversión y el envío a múltiples motores de búsqueda independientes preseleccionados. Todos los resultados de la consulta devueltos por cada motor de búsqueda independiente se centralizarán y procesarán antes de ser devueltos al usuario. . El primer metabuscador fue Metacrawler de Eric Selberg y Oren Etzioni, estudiantes de maestría en la Universidad de Washington.
En diciembre de 1995, DEC lanzó oficialmente AltaVista. AltaVista es el primer motor de búsqueda que admite búsquedas en lenguaje natural y el primer motor de búsqueda que implementa una sintaxis de búsqueda avanzada (como AND, OR, NOT, etc.). Los usuarios pueden utilizar AltaVista para buscar el contenido de grupos de noticias y obtener artículos de Internet. También pueden buscar texto en nombres de imágenes, buscar títulos, buscar subprogramas Java y buscar objetos ActiveX. AltaVista también afirma ser el primer motor de búsqueda que permite a los usuarios enviar o eliminar URL a la base de datos del índice web y puede conectarse en línea en 24 horas. Una de las novedades más interesantes de AltaVista es la búsqueda de todos los sitios web que tengan enlaces a una URL. AltaVista también ha realizado muchas innovaciones en la interfaz orientada al usuario.
Coloca "consejos" debajo del área del cuadro de búsqueda para ayudar a los usuarios a expresar mejor sus términos de búsqueda. Estos consejos se actualizan con frecuencia, de modo que después de buscar varias veces, los usuarios verán muchas funciones interesantes que quizás nunca hayan conocido. Esta serie de funciones poco a poco han sido ampliamente adoptadas por otros motores de búsqueda. En 1997, AltaVista lanzó LiveTopics, un sistema de presentación gráfica para ayudar a los usuarios a encontrar lo que buscan entre miles de resultados de búsqueda.
El 26 de septiembre de 1995, Eric Brewer, profesor asistente de la Universidad de California, Berkeley, y Paul Gauthier, estudiante de doctorado, fundaron Inktomi. El 20 de mayo de 1996, se fundó la empresa Inktomi. , y el poderoso HotBot apareció frente al mundo. Afirma ser capaz de rastrear e indexar más de 10 millones de páginas cada día, por lo que tiene mucho más contenido nuevo que otros motores de búsqueda. HotBot también utiliza ampliamente cookies para almacenar las preferencias de búsqueda personales de los usuarios.
En agosto de 1997 apareció oficialmente el motor de búsqueda Northernlight. Solía ser uno de los motores de búsqueda con la base de datos más grande. No tenía Stop Words. Tenía excelentes noticias actuales, una colección especial de más de 7100 publicaciones, buena sintaxis de búsqueda avanzada y fue el primero en admitir búsqueda automática simple. resultados.
Antes de octubre de 1998, Google era sólo BackRub, un pequeño proyecto de la Universidad de Stanford. En 1995, el estudiante de doctorado Larry Page comenzó a aprender a diseñar motores de búsqueda y registró el nombre de dominio el 15 de septiembre de 1997. A finales de 1997, con la participación de Sergey Brin, Scott Hassan y Alan Steremberg, BachRub comenzó a ofrecer demostraciones. En febrero de 1999, Google completó la transformación de la versión Alpha a la versión Beta. Google reconoce el 27 de septiembre de 1998 como su cumpleaños. Google determina la importancia de las páginas web basándose en el ranking de la página (Pagerank), lo que mejora enormemente la relevancia de los resultados de búsqueda. La cultura geek de Google y la filosofía No seas malvado le han valido a Google una gran reputación y reputación de marca. En abril de 2006, Google anunció su nombre chino "Google", que era el primer nombre de Google en un país de habla no inglesa.
Fast (Alltheweb) se fundó en 1997 como resultado de una investigación académica en la Universidad Noruega de Ciencia y Tecnología (NTNU). En mayo de 1999, lanzó su propio motor de búsqueda AllTheWeb. El objetivo fundamental de Fast es ser el motor de búsqueda más grande y rápido del mundo, y ha estado cerca de lograrlo en los últimos años. La búsqueda web de Fast (Alltheweb) puede usar ODP para clasificar automáticamente, admitir búsquedas en Flash y PDF, admitir búsquedas en varios idiomas y también proporcionar búsqueda de noticias, búsqueda de imágenes, videos, MP3 y FTP, y tiene una búsqueda avanzada extremadamente poderosa. funciones. (El 25 de febrero de 2003, Overture adquirió el departamento de búsqueda en Internet de Fast).
En agosto de 1996, se fundó la empresa sohu para producir catálogos de sitios web chinos. Alguna vez tuvo la reputación de "buscar mapas cuando sales y Sohu en Internet". Con el rápido aumento de los sitios web en Internet, este tipo de directorio de clasificación editado manualmente ya no es adecuado. Sohu creó el sitio web de búsqueda "Sogou" con un nombre de dominio independiente en agosto de 2004, llamándose a sí mismo el "motor de búsqueda de tercera generación".
Openfind se fundó en enero de 1998. Su tecnología se originó en el laboratorio GAIS dirigido por el profesor Wu Sheng de la Universidad Nacional Chung Cheng en Taiwán. Openfind comenzó como un motor de búsqueda chino únicamente. En su apogeo, también proporcionó motores de búsqueda chinos para los tres famosos portales Sina, Qimo y Yahoo. Sin embargo, después del año 2000, el mercado se dividió gradualmente entre Baidu y Google.
En junio de 2002, Openfind relanzó la versión Beta del motor de búsqueda Openfind basado en el Proyecto GAIS30, lanzó PolyRankTM, anunció que había rastreado un total de 3.500 millones de páginas web y comenzó a ingresar al campo de la búsqueda en inglés.
En enero de 2000, dos ex alumnos de la Universidad de Pekín, Robin Li, el inventor de la patente de análisis de hipervínculos y ex ingeniero senior de Infoseek, y su amigo Xu Yong (becario postdoctoral en la Universidad de California, Berkeley) fundaron Baidu en Zhongguancun, Beijing. La versión Beta del motor de búsqueda Baidu se lanzó en agosto de 2001 (anteriormente, Baidu solo proporcionaba motores de búsqueda para otros portales como Sohu, Sina, Tom, etc. El motor de búsqueda Baidu se lanzó oficialmente el 22 de octubre de 2001, centrándose en el idioma chino). buscar.
Otras características del motor de búsqueda de Baidu incluyen: instantánea de Baidu, vista previa de la página web/vista previa de todas las páginas web, términos de búsqueda relacionados, consejos para corregir errores tipográficos, búsqueda de mp3 y búsqueda Flash. Después del inicio del Proyecto Blitzen en marzo de 2002, las actualizaciones tecnológicas se aceleraron significativamente. Posteriormente se lanzaron una serie de productos como Tieba, Zhizhi, mapas, estudios chinos, enciclopedias, documentos, videos y blogs, que fueron muy populares entre los internautas. Cotizó en Nasdaq el 5 de agosto de 2005, con un precio de emisión de 27,00 dólares estadounidenses y nombre en clave BIDU. El precio de apertura fue de 66,00 dólares y cerró en 122,54 dólares, un aumento de 353,85, estableciendo un récord para el mayor aumento diario de nuevas acciones cotizadas en el mercado de valores estadounidense en cinco años.
El 23 de diciembre de 2003, la Búsqueda Huicong original operó oficialmente de forma independiente y estableció China Search. En febrero de 2004, China Search lanzó el motor de búsqueda de escritorio Internet Pig 1.0. En marzo de 2006, China Search cambió el nombre de Internet Pig a IG (Internet Gateway).
En junio de 2005, Sina lanzó oficialmente su motor de búsqueda desarrollado de forma independiente "Aiwen". Desde 2007, Sina iAsk utiliza el motor de búsqueda de Google.
El 1 de julio de 2007, NetEase adoptó por completo la tecnología de búsqueda Youdao desarrollada independientemente por NetEase y fusionó la búsqueda integral original y la búsqueda web. La búsqueda web, la búsqueda de imágenes y la búsqueda de blogs de Youdao brindan servicios para la búsqueda NetEase. Entre ellos, la búsqueda web utiliza su propia tecnología de procesamiento de lenguaje natural, almacenamiento distribuido y computación de imágenes, es la primera en utilizar funciones de búsqueda avanzadas basadas en marcas de cámaras, modelos e incluso temporadas, y la búsqueda de blogs tiene un rastreo completo y actualizaciones oportunas; a productos similares, proporcionando funciones innovadoras como "vista previa del artículo" y "archivos de blog".