Cómo hacer que las máquinas piensen como humanos: retratos de usuarios, personalidades y chatbots
[Inteligencia artificial] [Psicología del usuario] ?
Recientemente, compré un libro ilustrado para mi hija de tres años llamado "¿Puedo construir otro yo?" y ella no pudo. No lo dejes. El protagonista de este libro es un niño cansado de su vida normal. Espera entrenar a un robot para que tome su lugar en las siestas, las comidas y la asistencia puntual al jardín de infancia, para poder jugar libremente. Entonces compró el robot más barato y se lo llevó a casa para entrenarlo. En el proceso, el primer problema que encontró fue: ¿cómo puede el robot convertirse en él? Entonces, intentó decirle al robot todo tipo de información sobre él mismo, incluyendo su nombre, edad, altura, peso, padres, hermanos y mascotas, e incluso datos como "zurdo", "fácil de irritarse" y " los calcetines suelen tener agujeros".
El autor de este libro ilustrado tiene una gran imaginación y también piensa en los temas en los que estamos pensando. Esta historia también nos dice que el primer paso para que los robots tengan un pensamiento humano es entenderse a sí mismos. Porque de esta forma podremos decirle al robot qué hacer para parecerse más a nosotros mismos. Exploramos este tema desde los siguientes aspectos:
1. Inteligencia artificial y psicología
2. Clasificación y especulación de la personalidad
3. Cómo hacer robots como Think como humanos
Nuestro equipo ha estado involucrado en la investigación de retratos de usuarios durante mucho tiempo. ¿Qué es un retrato de usuario? En pocas palabras, se trata de utilizar los grandes datos generados por los usuarios para adivinar y comprender la edad, ocupación, intereses y pasatiempos de una persona, y también para describir los patrones de vida y movimientos de un grupo de personas. Esto nos hizo pensar: ¿podemos utilizar estos datos para profundizar en los corazones de las personas y comprender sus personalidades y emociones? No es fácil. Pero en el proceso de investigación descubrimos que estas cuestiones se han considerado en el campo de la psicología durante miles de años. De hecho, los dos campos de la inteligencia artificial y la psicología se han cruzado durante mucho tiempo.
Hace dos años, comenzamos a visitar a psicólogos y profesores famosos en un intento de llevar a cabo cooperación e intercambios interdisciplinarios. En este proceso, el primer problema que queremos resolver es la personalidad. ¿Se puede calcular la personalidad humana a partir de big data generados por los usuarios?
Aunque el término personalidad es muy común en la vida diaria, no es fácil dar una definición precisa y clara de personalidad. Incluso los psicólogos tienen dificultades para definir este término** *conocimiento. La definición más antigua de personalidad se remonta a hace más de 2.000 años (400 a. C.) La teoría del humor del antiguo científico médico griego Hipócrates creía que el cuerpo humano está compuesto de cuatro humores, que incluyen sangre, moco, bilis amarilla y bilis negra. La bilis y la distribución de estos cuatro fluidos corporales determinan la personalidad de una persona: la bilis negra produce una personalidad melancólica, la sangre produce una personalidad optimista, la bilis amarilla produce una personalidad impulsiva e irritable y el moco produce una personalidad tranquila. Aunque la medicina moderna ha negado la teoría humoral de Hipócrates, su discusión sobre la clasificación de la personalidad fue tan esclarecedora que los psicólogos posteriores continuaron explorando esta cuestión.
Cuando hablamos con psicólogos, descubrimos un hecho interesante: en la psicología moderna, la definición de personalidad está estrechamente relacionada con el uso del lenguaje. De hecho, en el campo de la informática también investigamos mucho sobre el lenguaje, lo que llamamos “comprensión del lenguaje natural”. En psicología, existe un concepto llamado "hipótesis del léxico". ¿Cuál es la hipótesis del léxico? Según esta hipótesis, no necesitamos observar y estudiar a varias personas para estudiar la personalidad. Simplemente podemos observar directamente palabras relacionadas en el lenguaje humano. Por ejemplo, si me presentas a un amigo, puedes usar un párrafo largo para describirlo: "Le gusta mucho hablar. Lo escucho hablar todo el tiempo. Es un conversador", etc. De hecho, este pasaje se puede resumir en una palabra: hablador. Entonces los psicólogos decidieron organizar estas palabras descriptivas. Si el vocabulario es reducido, pueden constituir la base para un sistema de clasificación.
A partir de estas observaciones, Allport y Odbert, los pioneros de la teoría de la personalidad, realizaron en 1936 un difícil y sistemático estudio del vocabulario inglés. Al revisar el diccionario, encontraron alrededor de 18.000 palabras en cuatro categorías: rasgos personales, emociones o comportamientos temporales e inteligencia y talentos, y además clasificaron más de 4.000 palabras que describen la personalidad. Aunque cuatro mil parece un número pequeño, sigue siendo muy complejo para todo el lenguaje del usuario.
Imagínese cuánto trabajo supondría puntuar cada una de las cuatro mil dimensiones descriptivas a la hora de describir la personalidad de una persona. Por eso quieren reducir aún más la escala. En el proceso, descubrieron que en realidad existían algunas correlaciones entre estas palabras. Por ejemplo, los extrovertidos suelen ser más conversadores y las personas tranquilas suelen ser más racionales, pero también pueden ser más introvertidas. Si se pueden localizar estas correlaciones, se podrán clasificar más de cuatro mil palabras sobre esta base.
En las últimas dos décadas, la definición de personalidad que ha recibido mayor atención y apoyo por parte de los investigadores de la personalidad es la "Teoría de los Cinco Grandes de la Personalidad". Incluye cinco factores de personalidad altamente generalizados: extraversión, escrupulosidad, neuroticismo, amabilidad y apertura. También hay algunos rasgos subdivididos en cada factor de personalidad (por ejemplo, la extroversión incluye si participa con frecuencia en actividades, si es de buen corazón, etc.). De esta forma, cuando presentes a tu amigo en el futuro, podrás describirlo como "una persona más extrovertida, pero no muy tranquila, y puede que sea más emotiva". El enfoque es simple, pero la descripción es completa.
De hecho, la organización de estas palabras y la generación de sistemas de clasificación de la personalidad se basan principalmente en datos y tienen muchas conexiones estrechas con la informática. Entonces, ¿podemos calcular automáticamente la personalidad de los Cinco Grandes del usuario? De hecho, esto también es posible.
En la medición tradicional de la personalidad, los psicólogos suelen utilizar entrevistas y cuestionarios, que requieren mucha mano de obra, recursos financieros y tiempo. Los sujetos a menudo se limitan a decenas o cientos de personas, y es imposible lograrlos. Medición de usuarios a gran escala. Pero existe otro método de medición de la personalidad en psicología llamado medición del comportamiento, que se evalúa observando el comportamiento individual. La base teórica para la medición del comportamiento es la coherencia del comportamiento humano en la teoría de la personalidad. Dado que la personalidad puede explicar diferencias individuales estables entre las personas, las diferencias en el comportamiento individual están estrechamente relacionadas con la personalidad del individuo. Por lo tanto, es posible predecir la personalidad observando el comportamiento individual. Sin embargo, antes de que la tecnología informática se utilizara ampliamente, a los psicólogos les resultaba difícil recopilar datos de comportamiento suficientemente ricos de los usuarios. Por lo tanto, la falta de datos dio lugar a que la medición del comportamiento no se utilizara ampliamente en la psicología tradicional.
En los últimos años, con la popularización de Internet, los teléfonos inteligentes y varios dispositivos de detección, se han recopilado ampliamente datos sobre el comportamiento de los usuarios, junto con el avance de los métodos de inteligencia artificial para modelar a los usuarios. utilizar datos de comportamiento para modelar a los usuarios. Los métodos de datos para medir la personalidad se están desarrollando rápidamente en la intersección de las computadoras y la psicología. Nuestro trabajo de investigación va más allá sobre esta base y propone un "modelo de inferencia de personalidad" que utiliza datos heterogéneos en las redes sociales (como fotos de avatar, textos publicados, uso de emoticones, relaciones sociales, etc.) para predecir la personalidad de los Cinco Grandes. Por ejemplo, en el caso de las imágenes, podemos calcular la representación semántica y luego agruparlas en determinadas categorías, como dibujos animados, selfies, fotografías de grupo, animales y plantas. El uso de métodos de inteligencia artificial basados en datos de comportamiento para predecir la personalidad requiere primero recopilar los resultados de los cuestionarios de un pequeño número de usuarios como anotaciones. Al marcar las características de comportamiento y de personalidad del usuario, el mapeo y las conexiones entre ellas se ingresan en el modelo para entrenar un buen modelo.
De hecho, encontramos un grupo de voluntarios que proporcionaron sus datos y completaron cuestionarios, por lo que teníamos ambos lados de los datos. Una vez entrenado el modelo, los nuevos usuarios no necesitan completar encuestas de usuarios y el modelo puede calcular automáticamente su personalidad. Suena abstracto pero en realidad es muy concreto.
Por ejemplo, podemos calcular la relación entre las publicaciones de los usuarios y la personalidad. La personalidad de los Cinco Grandes tiene cinco dimensiones y podemos calcular si existe una correlación particularmente positiva o negativa entre las palabras y cada dimensión. Por ejemplo, una persona que escribe a menudo sobre la juventud y sobre sí mismo en el círculo de amigos puede ser más extrovertida, mientras que un usuario que escribe a menudo sobre el fracaso y el enfrentamiento tendrá una puntuación de extroversión baja. También hay algunos usuarios que pueden escribir palabras que suenan muy positivas, como época, sociedad y éxito. Descubrimos que estas personas son más concienzudas. Por el contrario, algunas personas suelen escribir palabras como casual, lindo y temperamental, y descubrimos que su escrupulosidad es menor. Baja escrupulosidad no es un término despectivo: en este modelo, las personas que se preocupan por los resultados tienen mayor escrupulosidad, y las personas que se preocupan por el proceso tienen menor escrupulosidad. Ambos extremos tienen sus ventajas y no son ni mejores ni peores.
También calculamos el coeficiente de Pearson de los grupos de personalidad de los Cinco Grandes y de avatar de usuario para mostrar los grupos que están fuertemente correlacionados positiva o negativamente con la personalidad de los Cinco Grandes (se seleccionaron dos imágenes para mostrar en cada grupo). Dichos cálculos revelan algunos fenómenos interesantes: por ejemplo, los usuarios con puntuaciones altas en extraversión tienden a usar avatares que incluyen caras sonrientes, mientras que los usuarios con puntuaciones bajas a menudo cubren sus expresiones faciales o usan caras laterales en sus avatares; los usuarios con puntuaciones altas en apertura tienden a usar avatares que incluyen caras sonrientes. Las fotos con amigos se utilizan como avatares, mientras que muchos de los avatares de usuarios con puntuaciones de apertura bajas son selfies.
Nuestros resultados experimentales muestran que la precisión de la predicción de la personalidad individual puede alcanzar 0,6 utilizando únicamente fotos de avatar. No solo proponemos estrategias de extracción de características específicas para datos de comportamiento en cada dimensión, sino que también utilizamos tecnología de aprendizaje conjunto (Ensemble) para integrar de manera efectiva datos de comportamiento de diferentes dimensiones para mejorar la precisión de la predicción de la personalidad de los Cinco Grandes, haciendo que la personalidad de los Cinco Grandes individuales La precisión de La predicción supera el 0,75.
Después de comprender al usuario, el siguiente paso es cómo utilizar este conocimiento para ayudar al robot a pensar como un humano. Uno de los comportamientos importantes que los humanos esperan que puedan lograr los robots es el chat. Microsoft también ha propuesto el concepto de "conversación como plataforma" y cree que todas las interfaces hombre-máquina se transformarán en interfaces conversacionales en el futuro.
Hace dos años vi una serie de televisión que todavía recuerdo vívidamente. Era el primer episodio de la segunda temporada de la serie de televisión británica "Black Mirror", "Be Right Back". La serie de televisión describe una empresa de inteligencia artificial que puede sintetizar una persona virtual a partir de las redes sociales y los datos del chat en línea de una persona para imitar los rasgos de personalidad del personaje y tener una conversación con su novia. Esto puede parecer ciencia ficción, pero en realidad no está tan lejos de nosotros. Un informe de noticias de octubre de 2016 también mencionó que para conmemorar a su amigo fallecido Roman, Kuyda, un empresario de Rusia, utilizó sus 8.000 datos de mensajes de texto para entrenar un chatbot y lo lanzó oficialmente en mayo de 2016.
Aunque la tecnología ha avanzado mucho, ni siquiera los mejores chatbots todavía pueden hacer que las personas sientan que son personas vivas con personalidad y emociones estables. Se trata de cómo personalizar más el lenguaje y el comportamiento del robot.
Con la popularidad de las redes sociales, los datos de idioma con etiquetas de usuario se han vuelto fáciles de obtener. Al igual que la descripción del informe de noticias mencionada anteriormente, si tenemos suficientes datos sobre una determinada persona, es posible entrenar un chatbot con la misma personalidad que ella. Por supuesto, también podemos utilizar datos de un grupo de personas, como niños, estudiantes o incluso poetas, para entrenar un robot con las características de un tipo de persona. Por ejemplo, ¿podríamos recopilar datos sobre todos los poetas modernos y utilizarlos para entrenar a un robot para que exporte poesía? Se puede hacer ahora, pero a medida que la investigación se profundice, creo que eventualmente encontraremos obstáculos. Por ejemplo, cómo hacer que los robots tengan personalidades y emociones humanas más realistas, esto aún requiere la cooperación de los psicólogos.
De hecho, Eliza, el primer chatbot, era consejera psicológica.
Hace unos 50 años, Joseph, investigador del MIT, desarrolló Eliza. Al chatear con los usuarios, Eliza introdujo la Terapia Centrada en la Persona propuesta por el psicólogo Rogers, que enfatizaba actitudes más conversacionales, como el respeto y la empatía. De hecho, Eliza no toma la iniciativa de compartir contenido nuevo, ha estado guiando a los usuarios a hablar tanto como sea posible. El aparentemente inofensivo proyecto Eliza logró un éxito inesperado y sus efectos sorprendieron a los usuarios en ese momento. Como resultado, más tarde se acuñó un término llamado efecto ELIZA, que es un sentimiento psicológico de sobreestimación de las capacidades de un robot. El efecto ELIZA es realmente muy común ahora. Por ejemplo, tan pronto como apareció AlphaGo, que derrotó a los mejores jugadores, la gente sintió que las computadoras ya tenían la inspiración para jugar Go y que la inteligencia artificial pronto superaría a los humanos. Pero, de hecho, todos los programas detrás de AlphaGo están escritos por personas. La llamada inspiración y la llamada inteligencia al final se materializan mediante programas.
Inspirándose en el proyecto ELIZA, Microsoft Research Asia también lanzó el proyecto DiPsy. El objetivo de este proyecto es permitir que los robots charlen con las personas y las ayuden a superar problemas psicológicos. En este proyecto, recurrimos a la Terapia Cognitivo Conductual y la Atención Plena, que se utilizan habitualmente en el asesoramiento psicológico. DiPsy se caracteriza por guiar las conversaciones de forma natural y efectiva, permitiendo a los usuarios hablar libremente. También estudiará el proceso psicológico del usuario y realizará un diagnóstico basado en datos de los rasgos psicológicos y trastornos mentales del usuario. Utilizamos la terapia cognitivo-conductual (TCC) o la intervención temprana para cambiar el pensamiento y el comportamiento de los usuarios en diversos contextos terapéuticos y ayudar a los usuarios en riesgo a aliviar y gestionar los problemas psicológicos.
Esperamos que en el futuro este proyecto ayude a resolver problemas sociales prácticos, como el asesoramiento psicológico a los niños abandonados en las zonas rurales. En el Foro del Futuro celebrado no hace mucho, el vicepresidente ejecutivo global de Microsoft, Shun Xiangyang, dijo que quiere resolver tres enfermedades que están estrechamente relacionadas con el cerebro humano: el autismo infantil, la depresión de la mediana edad y la enfermedad de Alzheimer. Espero que nuestra tecnología pueda ayudarlo a lograrlo. Por supuesto, muchos de estos proyectos de investigación están todavía en sus inicios e implican mucha colaboración con académicos de otros campos, incluida la psicología, la sociología y las ciencias cognitivas. Espero comunicarme con más disciplinas en el futuro y obtener más inspiración e innovación en la investigación.
Esperamos eventualmente permitir que las máquinas piensen como humanos y brinden no solo ayuda sino también compañía cuando las personas lo necesiten. Cuando te sientes solo, al menos hay una IA contigo.
Gráfico de conocimiento:
Coeficiente de Pearson: se utiliza para medir la correlación (correlación lineal) entre dos variables X e Y, con un valor entre -1 y 1. En las ciencias naturales, este coeficiente se utiliza ampliamente para medir el grado de correlación entre dos variables.
Aprendizaje conjunto: un método de aprendizaje automático que utiliza una serie de alumnos para aprender y utiliza ciertas reglas para integrar los resultados del aprendizaje para obtener mejores resultados de aprendizaje que un solo alumno.