Cómo hacer un chatbot
Poder hacer que las máquinas comprendan el lenguaje humano o imiten el lenguaje humano es la fantasía original de la inteligencia artificial. Por lo tanto, en los primeros días, la prueba de Turing se convirtió en el estándar para juzgar la inteligencia artificial.
El diálogo y la traducción aplican el Procesamiento del Lenguaje Natural (PNL) que forma parte de muchas ramas de la inteligencia artificial. Su objetivo es resolver el problema de comunicación entre humanos y máquinas y es el origen del procesamiento de la inteligencia artificial, al que aún se enfrentan muchos. problemas.
Tomemos como ejemplo el sistema de diálogo. Los gigantes del mercado han lanzado sus propios asistentes de voz inteligentes, pero muy pocos pueden escapar completamente a la sospecha de "retraso mental".
Se puede decir que en esta pista todo el mundo corre muy rápido. Pero a pesar de ello, sigue insistiendo en funcionar. Incluso Siri, que lleva mucho tiempo atrapada en los teléfonos móviles, también lanza su propio altavoz inteligente.
"Aunque la situación actual no es muy optimista, si sigues corriendo siempre verás resultados." Si persistimos durante otros 5 a 10 años, el procesamiento del lenguaje natural marcará el comienzo de un desarrollo sustancial.
El primer nivel es la tecnología básica: segmentación de palabras, etiquetado de partes del discurso y análisis semántico.
La segunda capa es la tecnología central: la representación de palabras, frases, oraciones y capítulos. Incluyendo traducción automática, respuesta a preguntas, recuperación de información, extracción de información, chat y diálogo, ingeniería del conocimiento, generación de lenguaje y sistemas de recomendación.
La tercera capa es "NLP+": inspirada en el concepto de "inteligencia artificial+" o "Internet+", en realidad es la profundización de la tecnología de procesamiento del lenguaje natural en diversas aplicaciones y campos verticales. Los más famosos incluyen motores de búsqueda, servicio al cliente inteligente, inteligencia empresarial y asistentes de voz, y hay muchas más aplicaciones en diversos campos verticales como el derecho, la atención médica y la educación.
En el tercer nivel "NLP+", hay muchos asistentes de voz grandes y pequeños en el mercado, y hay dos graduados de Microsoft: Cortana y Xiaobing. Aunque ambos son asistentes de voz, existen algunas diferencias entre ellos.
De hecho, ya sea un lenguaje pequeño como Xiaoice o una tecnología como Cortana que se centra en la ejecución de tareas, detrás de esto no hay más que una tecnología de motor de procesamiento unitario de tres capas.
El primer nivel: chat general. Debe dominar las habilidades de comunicación, los datos generales del chat, los datos del chat temático y comprender la información del usuario y atender sus preferencias.
El segundo nivel: servicios de información y preguntas y respuestas, que requiere la capacidad de buscar y responder preguntas. También requiere recopilar, organizar y buscar tablas de preguntas frecuentes, encontrar la información correspondiente a partir de gráficos, documentos y diagramas de conocimiento. y responderlas, estos se denominan colectivamente robots de información.
El tercer nivel: capacidades de diálogo para tareas específicas, como pedir café, pedir flores, comprar billetes de tren, etc. Las tareas son fijas, el estado también es fijo y la transición de estado también es clara, que se puede realizar una por una a través de Bot. A través del sistema de programación, la intención del usuario llama al Bot correspondiente para realizar la tarea correspondiente. Las tecnologías que utiliza incluyen la comprensión de las intenciones del usuario, la gestión del diálogo, el conocimiento del dominio, el mapeo del diálogo, etc.
Además de crear Xiaona Bing, Microsoft también espera permitir a los desarrolladores desarrollar sus propios Bots a través de lanzamientos tecnológicos. Si la máquina del desarrollador no puede entender el lenguaje natural, esto se puede lograr mediante una herramienta llamada Bot Framework.
Cualquier desarrollador puede completar sus necesidades de Bot a través de Bot Framework con sólo unas pocas líneas de código. Por ejemplo, si alguien quiere crear un Bot que entregue pizza, puede usar Bot Framework para completar el conocimiento y los datos correspondientes para implementar un Bot simple. Muchos propietarios de pequeñas empresas sin capacidades de desarrollo pueden hacer que un pequeño Bot atraiga a muchos clientes mediante operaciones simples.
En esta plataforma de código abierto, hay muchas tecnologías clave de XiaoIce. Microsoft tiene una plataforma llamada LUIS (Language Understanding Intelligent Services), que brinda la capacidad de comprender la intención del usuario, reconocimiento de entidades, gestión de diálogos, etc.
Por ejemplo, la frase "léame los titulares" se reconoce como resultado de la lectura en voz alta, y el contenido son los titulares del día. Otro ejemplo es "pausa de 5 minutos". El resultado del reconocimiento es una pausa. Hay un parámetro: 5 minutos. Con LUIS, puedo extraer la intención y la información importante para que la lea el bot.
Estas conversaciones no requieren trabajo intelectual para los humanos, pero para las máquinas, la dificultad ha alcanzado otro nivel.
El Dr. Zhou Ming cree que la inteligencia artificial se divide en cuatro niveles de abajo hacia arriba: inteligencia computacional, inteligencia perceptual, inteligencia cognitiva e inteligencia creativa.
La inteligencia computacional ha alcanzado un nivel muy alto, tal y como dicen los mejores jugadores de Go del mundo sobre AlphaGo.
La segunda es la inteligencia perceptiva, que se refleja principalmente en el oído, la visión y el tacto, que es lo que solemos llamar tecnología de la voz y tecnología de la imagen. La tecnología de voz se usa mucho, como permitir que Siri entienda lo que usted dice. El reconocimiento de imágenes se usa principalmente para el reconocimiento facial. Las empresas que siguen la tendencia tecnológica generalmente cambian el control de acceso al reconocimiento facial.
La inteligencia cognitiva es el foco de nuestra discusión de hoy, que incluye principalmente el lenguaje, el conocimiento y el razonamiento. ¿Cuál es la importancia del lenguaje? Siri no puede simplemente reconocer lo que estás diciendo, necesita reaccionar en función de lo que estás diciendo y, en ese caso, debe entender lo que estás diciendo.
Cuando la inteligencia artificial tiene imaginación, crear inteligencia es el estado más elevado.
Las máquinas han sido capaces de alcanzar una precisión muy alta en computación, reconocimiento de voz e imágenes, y la principal brecha ahora reside en la inteligencia cognitiva. En el pasado, la inteligencia cognitiva se centraba principalmente en el procesamiento del lenguaje natural, es decir, simplemente comprender oraciones y capítulos, ayudar a los motores de búsqueda y sistemas de imitación a proporcionar algunas funciones básicas y proporcionar algunas traducciones de conversaciones simples.
Para el desarrollo futuro de la inteligencia de voz, el Dr. Zhou Ming cree que hay varias direcciones:
Primero, con la promoción de los tres elementos principales del big data, el aprendizaje profundo, y la computación en la nube, máquinas parlantes. La traducción será completamente universal.
En segundo lugar, el diálogo en lenguaje natural, el chat, las preguntas y respuestas y el diálogo han alcanzado niveles prácticos.
En tercer lugar, la combinación perfecta de servicio al cliente inteligente y servicio al cliente manual sin duda mejorará en gran medida la eficiencia del servicio al cliente.
En cuarto lugar, escribir automáticamente coplas, poemas, notas de prensa, canciones, etc.
En quinto lugar, en términos de diálogo, asistentes de voz, Internet de las cosas, hardware inteligente, hogares inteligentes, etc., básicamente se puede aplicar cualquier cosa que utilice la interacción persona-computadora.
Finalmente, estos aspectos del lenguaje natural serán ampliamente utilizados en muchos escenarios como derecho, diagnóstico médico, consulta médica, consulta legal, inversión y financiación, etc.
Por supuesto, el lenguaje natural actual también se enfrenta a muchas dificultades. El más crítico de ellos es cómo aprovechar al máximo los datos sin etiquetar mediante el aprendizaje no supervisado. Ahora todos dependen de datos etiquetados y no hay forma de aprovechar los datos no etiquetados. Sin embargo, en muchos escenarios, no hay suficientes datos de etiquetas y el costo de encontrar etiquetas manuales es muy alto. Reimpreso de The Machine Man, espero que te resulte útil.
Entonces, ¿cómo utilizar estos datos sin etiquetar? Esto puede mejorar todo el proceso de aprendizaje a través de lo que se denomina proceso de aprendizaje no supervisado o proceso de aprendizaje semisupervisado.
Dale algo de tiempo a la PNL y un asistente de voz podrá convencerte de que en realidad se trata de inteligencia artificial.