Ayuda a encontrar información sobre el historial, las funciones y los consejos de uso de Word.
- El prototipo de WordNet se remonta a más de 20 años y no fue hasta 1985 que comenzó a volverse concreto y claro. A partir de 1985, WordNet estaba en pleno apogeo como proyecto de conocimiento. Aun así, la WordNet de aquella época era muy diferente de la WordNet actual, más de 10 años después.
- Una de las premisas originales del proyecto fue la "hipótesis de la separabilidad", la idea de que los componentes léxicos de una lengua pueden separarse y especializarse. La historia de la lexicología nos enseña claramente que se pueden obtener resultados útiles de investigación a nivel de palabras. Por supuesto, el diccionario (diccionario, tesauro) no es completamente independiente de otros componentes del lenguaje, pero ciertamente puede separarse de otros componentes del lenguaje. Por ejemplo, el conocimiento fonético y gramatical se forma en los primeros años de vida de una persona, mientras que el léxico puede aumentar con la acumulación continua de actividades intelectuales. Esto sugiere que diferentes componentes del lenguaje implican diferentes procesos cognitivos.
- Otra premisa es la hipótesis del patrón: a menos que una persona pueda explotar patrones sistemáticos y relaciones entre palabras y significados, no puede dominar todo el vocabulario necesario para utilizar un idioma. Este modo sistemático de pensar ha sido objeto de especulación desde al menos la época de Platón, y la investigación lingüística moderna ha comenzado a identificar tales patrones en la estructura semántica de las lenguas naturales. Sin embargo, muchos trabajos de investigación excelentes en esta línea han encontrado dificultades en este tema. Un autor podría proponer una teoría semántica y demostrarla con ejemplos de 20 a 50 palabras en inglés, dejando las otras 100.000 palabras como ejercicio para el lector.
- La tercera premisa es el llamado supuesto de integralidad: si la lingüística computacional espera poder procesar el lenguaje natural como los humanos, entonces necesita almacenar tanto conocimiento léxico como los humanos.
- Uno de los métodos para crear diccionarios a gran escala que contengan descripciones del significado de las palabras es el método de semántica de palabras componentes (también traducido como análisis del significado de palabras) basado en el análisis de componentes semánticos. Este enfoque analiza el significado de las palabras como una combinación de átomos conceptuales más pequeños. Sin embargo, definir un conjunto de átomos conceptuales no es trivial. De hecho, el planificador de WordNet, George A. Miller, fue coautor del libro Language and Perception de 1976 con Philip N. Johnson-Laird y Perception), exploró vacilantemente la descripción semántica de los morfemas, pero hasta 1985 no logró proponer una descripción completa. definición.
-En 1985, todavía no había sido capaz de llegar a una definición completa, una lista clara de todos los átomos conceptuales.
- En 1985, muchos psicólogos cognitivos y lingüistas computacionales comenzaban a utilizar "redes" para describir el significado de las palabras. Por ejemplo, "mesa" y "muebles" representan dos nodos con una flecha (dardo) entre ellos, indicando proposiciones como "la mesa es un tipo de mueble", "la mesa es un tipo de mueble", "la mesa es un tipo de mueble", etc., es decir, la relación semántica "Es-UN-tipo-de". Con la profundización de la investigación en este campo, cada vez más personas son conscientes de que, además de utilizar componentes semánticos (análisis deóntico) para expresar la semántica, las relaciones (semántica léxica basada en relaciones) también se pueden utilizar para expresar la semántica. y este último podrá sustituir al primero.
- En los primeros días de WordNet, los investigadores consideraron principalmente si los métodos de semántica relacional para describir el significado de las palabras podrían usarse ampliamente a escala, y no solo a nivel de demostraciones de juguetes. Una vez que los investigadores estuvieron convencidos de que el enfoque funcionaría, comenzaron a escribir aplicaciones para hacer realidad la idea.
De hecho, al principio, Miller no tenía una idea completa de cómo desarrollar un vocabulario amplio. La idea inicial es descubrir los nodos de palabras más importantes compuestos por cadenas y explorar los patrones de relación semántica entre ellos. La idea era que si se obtenía el patrón correcto de relaciones semánticas, la definición de la palabra podría derivarse de él, de modo que la definición del significado de la palabra sería redundante para la red de relaciones sobre el significado de la palabra.
- En 1978, Miller propuso la idea de un "diccionario automático". Pero en ese momento no sabía cómo implementar la idea. Gracias al apoyo de la Fundación Sloan, la Fundación Spencer y el Centro de Investigación Watson de IBM, Miller no abandonó la idea. En 1984, Miller incluso había construido una pequeña red semántica de 45 sustantivos en una PC IBM, a la que llamó "red de palabras", y demostró el ejemplo en IBM y Bell Core. Sus amigos de Bell Nuclear, Lance Miller, Roy Bird, Michael Lesk, Donald Walker, Robert Amsler y Stephen Hansen lo alentaron a continuar y le brindaron mucha práctica y orientación técnica.
- Lesk invitó a Miller a la primera reunión del New Oxford English Dictionary Centre, celebrada en la Universidad de Waterloo en Canadá en noviembre de 1985, donde Miller presentó un artículo explicando cómo podríamos utilizar conjuntos de sinónimos para ver que representa conceptos léxicos y describe que podemos usar conjuntos sintéticos para representar conceptos léxicos y describir matrices léxicas, es decir, el mapeo entre formas y significados de palabras. De hecho, esta fue la idea principal que guió la investigación que condujo al desarrollo de WordNet.
- Sin embargo, el título del discurso de Miller en esa conferencia puede ser más significativo que el punto que planteó. El título fue propuesto por Lesk, WordNet: A Dictionary Browser. Aquí, WordNet se ve (y se concibe) como un navegador de diccionarios, un complemento de los diccionarios legibles por máquina. Este diccionario automático no es alfabético en el sentido tradicional, sino que se basa en significados.
- Justo cuando WordNet estaba tomando forma, Miller colaboró con algunos colegas de ideas afines en la Universidad de Princeton en un programa de investigación cognitiva, dirigido por Richard Cullingford de 1983 a 1985. Visitó la Universidad de Princeton. Richard Cullingford visitó Princeton de 1983 a 1985, y él, Gilbert Herman y Miller persuadieron al rector Neil Rudenstine para que le proporcionara una microcomputadora. Esta computadora se convirtió en la pieza central del Laboratorio de Ciencias Cognitivas de Princeton. Con este equipo en mano, Miller convenció a Susan Chipman de la Oficina de Investigación Naval para que los contratara para desarrollar WordNet. En marzo de 1986, James S. Herman firmó un contrato con el Instituto de Investigación del Ejército para desarrollar una teoría computacional de la semántica léxica1. En marzo de 1986, la Fundación James S. MacDonald otorgó una generosa subvención a la Universidad de Princeton para apoyar la investigación en ciencias cognitivas. En 1985, Mary Bienkowski (estudiante de posgrado en Cullinford) y experta en informática comenzó a trabajar con nosotros y pronto desarrolló el software que necesitábamos. Desde entonces, WordNet se ha convertido en uno de varios proyectos de investigación en el nuevo Laboratorio de Ciencias Cognitivas de Princeton y ha comenzado a operar.
- El programa más importante utilizado para crear WordNet es el llamado programa Grinder, escrito en LISP por Bienkowski en 1986, reescrito en C por Dan Teibel en 1987, y nuevamente por Antonio Romero en 1989 Write. Randee Tengi ha gestionado todas estas versiones del programa desde 1991.
- Las palabras en WordNet provienen de una variedad de fuentes: Brown's Corpus, Laurence Urdan's Small Dictionary of Synonyms and Antonyms (1978), Rodale Thesaurus revisado de Urdan (1978) y Robert Chapmand's Rogers' Thesaurus (1977). 4ª edición. A finales de 1986, Miller obtuvo una lista de palabras de Fred Zhang del Centro de Investigación y Desarrollo Naval. Miller comparó la lista de palabras de Zhang con la lista de palabras existente de WordNet. El resultado fue desalentador, solo 15. Las palabras se superpusieron, por lo que Miller agregó la palabra de Zhang. lista a WordNet en 1993. Miller obtuvo una lista de vocabulario de 39.143 palabras de Ralph Grishman y sus colegas de la Universidad de Nueva York, que en realidad está incluida en el famoso diccionario COMLEX. El resultado de la comparación es que WordNet sólo contiene 74 palabras de COMLEX. Entonces Miller volvió a agregar la lista de palabras a WordNet.
- A medida que aumenta la longitud de la lista de palabras, la presión de clasificación también comienza a aumentar. El primer paso en la diferenciación es a través de categorías sintácticas. Creamos archivos separados para sustantivos, verbos y adjetivos (adverbios agregados después de 1992). Sin embargo, dentro de cada categoría sintáctica, todavía hay demasiadas palabras que son difíciles de dominar sin una mayor clasificación. Los sustantivos son los más problemáticos porque son una parte abierta del discurso.
- En la primavera de 1987, Philip N. Johnson-Laird llegó a la Universidad de Princeton procedente del Instituto de Psicología Aplicada de Cambridge, Inglaterra. Descubrió que WordNet carecía de una forma de distinguir los cambios de significado cuando los adjetivos modifican diferentes sustantivos. Usó 266 pares de adjetivos antónimos (que WordNet incluyó en ese momento) para clasificar subclases de sustantivos en función de qué tan bien los modificaban. El resultado fueron unas 25 subclases de sustantivos. Estas subclases forman la clasificación básica de sustantivos. Estas subclases de sustantivos también se separan en archivos individuales separados que son procesados por diferentes investigadores, impulsando así el progreso de WordNet desde una perspectiva de ingeniería.
- En el verano de 1987, Christiane Fellbaum se unió al equipo de investigación y asumió la tarea de subclasificar los verbos.
- Sólo Kitty Miller es responsable de los adjetivos descriptivos. Desde el principio, los adjetivos descriptivos han sido una gran categoría sin subdivisión. Todos estos adjetivos también se mantienen en uno en archivos enormes.
- WordNet ha evolucionado desde un simple "explorador de diccionarios" hasta una base de datos de vocabulario independiente, con importantes desarrollos que comenzaron a principios de 1989. A principios de 1989 comenzaron a producirse acontecimientos importantes. Susan Chipman no estaba satisfecha con la mera existencia de WordNet como navegador de sinónimos y pidió al equipo de investigación que desarrollara una herramienta basada en el éxito de WordNet como navegador de sinónimos. Esta herramienta puede leer texto basado en WordNet e informar diversa información sobre las palabras del texto. Esta herramienta se llama "Filtro de palabras". Se pueden filtrar palabras raras o inapropiadas de documentos nuevos y usar palabras más comunes en su lugar. Este trabajo pronto nos hizo darnos cuenta de que teníamos que lidiar con las inflexiones de las formas de las palabras. Esto nos permite solucionar algunos problemas relacionados con la forma de la palabra; WordNet solo contiene la forma básica de la palabra y, si hay "barco" en el texto, WordNet no lo reconocerá. Richard Beckwith y Miceael Colon escribieron un programa llamado Morphy que puede reconocer la palabra "barco" por "barco" en el texto. En septiembre de 1989, WordNet podía procesar cambios de palabras en el texto y encontrar las formas base correspondientes en el léxico.
- El trabajo anterior condujo a otro avance importante en la vinculación de palabras en el texto con sus significados correspondientes en WordNet, con el desarrollo de una interfaz por parte de Claudia Leacock (se incorporó en noviembre de 1991) y Brian Gustafson ConText, que puede preprocesar el texto (creación de instancias, lexicalización, anotación sintáctica automática, etc.) y utilizar el texto de diversas maneras. En junio de 1993, Shari Landes fue responsable de integrar un conjunto completo de herramientas de anotación (incluido un conjunto de morfemas) en Together, estas herramientas. maximizar la salida de texto inequívoco. La anotación semántica de texto mejora enormemente la cobertura léxica y semántica de WordNet.
- Otro cambio importante en WordNet se produjo en la primavera de 1989, cuando Antonio Romero modificó el programa Grinder para que pudiera aceptar definiciones interpoladas (o "anotaciones") como parte de un synset. A medida que aumenta el número de palabras en WordNet, resulta cada vez más difícil distinguir el significado de una palabra de la forma más inequívoca posible manteniendo al mismo tiempo la pureza del conjunto de sinónimos. En otras palabras, no basta con definir el significado de una palabra mediante sinónimos. Inicialmente, las anotaciones de WordNet se mantenían lo más breves posible. Pero después de un año, las notas empezaron a ser cada vez más largas. El número de anotaciones también empezó a crecer de manera constante. En abril de 1989, WordNet contenía 37.409 conjuntos sintéticos sin anotaciones; en julio de 1991, WordNet contenía 44.983 conjuntos sintéticos con 13.688 anotaciones (30 en enero de 1993, WordNet contenía 61.023); conjuntos de sinónimos y 36.880 anotaciones (60); en enero de 1994, WordNet contenía 79.542 conjuntos de sinónimos y 58.705 anotaciones (74 de los conjuntos de sinónimos);
- Los investigadores de WordNet siempre han visto WordNet como un experimento, no como un producto. La versión 1.3 se publicó en diciembre de 1992; la versión 1.4 se publicó en agosto de 1993; la versión 1.5 se publicó en marzo de 1995. Actualmente hay más de 1000 personas y organizaciones en la lista de correo de WordNet. Muchos investigadores descargaron WordNet y lo utilizaron de diferentes maneras.
- WordNet está financiado por la Oficina de Investigación Naval, la Agencia de Proyectos de Investigación Avanzada, la Fundación James S. MacDonald y, más recientemente, el Consorcio de Datos Lingüísticos. Consorcio de Datos Lingüísticos).
Las principales funciones y características de Word
Las principales funciones y características de Word==gt; Iniciar y salir de Word
------- -------------------------------------------------- -- ---------- -----------
Las principales funciones y características de Word se pueden resumir en las siguientes:
(1) Lo que ve Es decir, los usuarios pueden utilizar el software Word para organizar documentos de modo que el efecto de impresión se pueda ver claramente en la pantalla.
(2) Interfaz intuitiva El software Word tiene una interfaz amigable y proporciona una variedad de herramientas. Puede usar el mouse para completar operaciones como selección y composición tipográfica.
(3) El software Word de uso mixto multimedia puede editar gráficos de texto, imágenes, sonidos, animaciones y también puede insertar información producida por otro software. También puede utilizar las herramientas de dibujo proporcionadas por el software Word para crear gráficos. , editar arte, fórmulas matemáticas, etc., para cumplir con diversos requisitos de procesamiento de documentos de los usuarios.
(4) Potente función de tabulación El software Word proporciona una poderosa función de tabulación, no solo tabulación automática, sino también tabulación manual. Las filas de la tabla de Word están protegidas automáticamente, los datos de la tabla se pueden calcular automáticamente y la tabla se puede modificar de diversas formas. En el software Word, también puedes insertar hojas de cálculo directamente. Usar el software Word para crear tablas es conveniente, hermoso, rápido y conveniente.
(5) Función automática El software Word proporciona funciones de revisión ortográfica y gramatical para mejorar la corrección de la edición de artículos en inglés. Si se encuentran errores gramaticales o ortográficos, el software Word también proporcionará sugerencias de modificación. Al editar documentos con el software Word, Word ayudará a los usuarios a escribir resúmenes automáticamente, lo que les ahorrará mucho tiempo. La función de corrección automática proporciona una gran ayuda para que los usuarios ingresen los mismos caracteres. Los usuarios pueden definir la entrada de caracteres ellos mismos. Cuando los usuarios desean ingresar la misma cantidad de caracteres, pueden definir una letra para reemplazar, especialmente en la entrada de caracteres chinos. Esta función mejora enormemente la velocidad de entrada del usuario.
(6) Plantillas y asistentes El software Word proporciona una gran cantidad de plantillas enriquecidas, lo que permite a los usuarios crear rápidamente los formatos correspondientes al editar un determinado tipo de documento. Además, el software Word permite a los usuarios definir plantillas por sí mismos. Proporciona a los usuarios un método eficiente y rápido para crear documentos para necesidades especiales.
(7) Funciones de ayuda enriquecidas Las funciones de ayuda del software Word son detalladas y ricas. El software Word proporciona ayuda visual y conveniente, lo que permite a los usuarios encontrar soluciones a los problemas cuando los encuentran. Proporciona comodidad para que los usuarios estudien por su cuenta.
(8) Las herramientas web son compatibles con Internet (Internet), que es uno de los aspectos más extensos y populares de las aplicaciones informáticas en la actualidad. El software Word brinda soporte para que los usuarios de la Web puedan seguir la Web de manera rápida y sencilla. asistente de páginas Para crear una página web (comúnmente llamada página web), también puede utilizar la barra de herramientas web del software Word para abrir, buscar o explorar rápidamente varios documentos, incluidas páginas web y documentos web.
(9) El software Word puede admitir documentos en múltiples formatos y también puede convertir documentos editados en Word en documentos en otros formatos y guardarlos en el disco. Word puede editar correos electrónicos, sobres, notas, informes, páginas web, etc.
(10) Potente función de impresión El software Word proporciona una función de vista previa de impresión, con potente compatibilidad con parámetros de impresora y capacidad de configuración.