Una breve discusión sobre los pasos de la recomendación de contenido personalizado
Ahora estamos en una era de explosión de la información, en la que cada día se generan decenas de millones de información. Sin embargo, el tiempo por día no se ha convertido en 24 + 1 horas y, sumado al consumo de tiempo fragmentado, es crucial entregar contenido con precisión. También se puede decir que 2017 es el año de la explosión de la inteligencia artificial. Varias empresas han comenzado a establecer laboratorios de inteligencia artificial para explorar conjuntamente cosas que pertenecen al futuro. Ya sea un altavoz inteligente o un asistente de voz, el objetivo de todos es comprender las preferencias e intereses del usuario. Ayuda a los usuarios a ahorrar tiempo y hacer más cosas, como tener una secretaria personal que los comprenda mejor y pueda ayudarlos a completar los preparativos de la evaluación.
Desde la era web1.0 anterior hasta la era 3.0, el objetivo ha sido ofrecer contenido preciso a los usuarios. La organización y resumen del contenido recomendado en función de los datos y la comprensión personal se puede dividir en tres pasos: establecer inicialmente retratos de usuarios, recomendar contenido basado en estrategias y mostrarlo de manera razonable y eficiente.
Después de que un nuevo usuario ingresa a la APLICACIÓN, ésta se encuentra en la etapa de inicio en frío. El modelo de usuario se establece inicialmente obteniendo la información básica del usuario, como sexo, edad, ocupación, ciudad, tipo de preferencia, etc. ., datos de atributos del usuario. El paso de adquisición se denomina guía para principiantes. Al marcar al usuario por primera vez, se realizan recomendaciones de contenido preliminares para reducir la irrelevancia del contenido recomendado durante el inicio en frío.
En este paso, es solo el primer paso para comprender aproximadamente lo que les gusta a los usuarios y promocionar con precisión el contenido que los usuarios necesitan. Por ejemplo, cuando se recomiendan teléfonos móviles a los usuarios, hay un azul brillante impresionante y un negro brillante estable. Los usuarios pueden decir que el azul es realmente hermoso. Sin embargo, lo que al final se llevaron fue un teléfono móvil negro. Por tanto, el comportamiento del usuario antes de la acción final tiene un cierto grado de desviación. En términos de selección de contenido, tome la aplicación de música como ejemplo. Cuando el usuario selecciona los atributos de después de los 90, niños y mandarín, es posible que el contenido enviado no necesariamente logre los resultados esperados en escenarios de uso reales.
En este punto, se requiere el segundo paso para mejorar continuamente el modelo de usuario en función de los datos de comportamiento del usuario. Incluyendo, entre otros, datos de seguimiento de front-end, datos de registro de back-end, preferencias de comportamiento, etc. cuando los usuarios utilizan la APLICACIÓN.
A través de estos dos pasos, los retratos de los usuarios se pueden esbozar de forma aproximada. Sin embargo, los retratos de los usuarios son muy dinámicos, por lo que los retratos de los usuarios también deben aprenderse y mejorarse continuamente. Los pasos específicos para representar los retratos de los usuarios pueden ser Ver información. relacionado con la construcción del retrato del usuario.
Existen muchas estrategias comúnmente utilizadas para recomendar diferentes contenidos a diferentes usuarios. En diferentes tipos de productos, la combinación de aplicaciones también es diferente. A continuación se muestran algunos métodos de recomendación comunes.
La recomendación basada en demografía (Recomendación basada en demografía) es un método de recomendación de bajo costo que descubre la similitud entre usuarios en función de información básica sobre los atributos del usuario y luego combina los elementos que les gustan a usuarios similares. recomendado.
En este proceso, el sistema establece un modelo para cada usuario basado en los atributos propios de cada usuario. Luego, la similitud se calcula en función de los atributos del usuario. Si ve que el usuario A es similar al usuario C, entonces los usuarios A y C se considerarán usuarios similares y, finalmente, podrán denominarse "vecinos" y se recomendará el contenido correspondiente al usuario actual en función de las preferencias del "vecino". "grupo de usuarios.
Ventajas: Dado que no es necesario utilizar los datos del historial de preferencias del usuario, se puede resolver el problema del "arranque en frío" para los nuevos usuarios. Este método no depende de los datos del proyecto en sí, por lo que se puede utilizar en campos de diferentes proyectos. Es independiente del dominio.
Desventajas: el método de clasificar a los usuarios según la información de los atributos del usuario es demasiado aproximado, especialmente en campos más verticales, como libros, películas y música, y no puede lograr buenos resultados de recomendación. Cuando el primer grupo de usuarios hace recomendaciones, los datos básicos para clasificar elementos de contenido se dividen artificialmente por operaciones, lo que tiene un gran impacto en la precisión. Además, cuando se trata de información de contenido que es demasiado sensible o privada, el costo de adquisición es relativamente alto, lo que resultará en resultados inferiores a las expectativas del usuario.
Recomendación basada en contenido, la idea central es establecer etiquetas como palabras clave o etiquetas en función de los metadatos del contenido y establecer las relaciones correspondientes en función de su relevancia. Durante el proceso de distribución de contenido, los atributos de los retratos de los usuarios se utilizan para hacer recomendaciones coincidentes. Aunque este método es demasiado subjetivo, puede modelar bien las preferencias del usuario a nivel de contenido, y a los usuarios a los que les gusta el rock no se les recomendarán baladas. Este método recomendado se utiliza principalmente en algunas aplicaciones de contenido de información.
Ventajas: fácil de implementar, no requiere datos de atributos del usuario y reduce los problemas de arranque en frío. Emparejamiento basado en la relevancia del contenido, con una única dimensión, no habrá sobrecalentamiento del contenido popular ni impopularidad del contenido impopular.
Desventajas: la clasificación y el etiquetado manuales inevitablemente tendrán defectos en la precisión y amplitud de las recomendaciones, lo que dará como resultado un contenido recomendado insuficientemente preciso.
El etiquetado de funciones extraído por el sistema debe garantizar la precisión; y Para que tengan cierta importancia práctica, se reducirá la relevancia de los resultados de las recomendaciones.
La recomendación basada en filtrado colaborativo es un método de recomendación ampliamente utilizado en sistemas de recomendación. Se considera un modelo de utilización de inteligencia colectiva y se basa en la suposición de que "los pájaros del mismo plumaje se juntan y las personas se juntan". " . Incluye principalmente tres dimensiones de recomendación: recomendación basada en el usuario, recomendación basada en proyectos y recomendación basada en modelos.
El principio básico de la recomendación de filtrado colaborativo basado en usuarios es descubrir grupos de usuarios "vecinos" similares a las preferencias del usuario actual en función de las preferencias de contenido de todos los usuarios. Proporcionar a los usuarios actuales hacer recomendaciones.
Ventajas: El contenido recomendado puede ser completamente irrelevante, por lo que se pueden descubrir los intereses potenciales del usuario y se pueden generar resultados de recomendaciones personalizados para cada usuario.
Desventajas: la tasa de crecimiento de los usuarios es mucho mayor que la tasa de crecimiento de los proyectos, por lo que la cantidad de cálculo aumenta enormemente y el rendimiento del sistema puede convertirse fácilmente en un cuello de botella. Generalmente, los sistemas de filtrado colaborativo basados en usuarios lo son. Se utiliza junto con otros mecanismos.
Comparación entre recomendaciones de filtrado colaborativo basadas en usuarios y recomendaciones basadas en datos demográficos:
Puntos similares: ambos calculan la similitud de los usuarios y calculan las recomendaciones basadas en grupos de usuarios "vecinos"
Diferencia: el mecanismo basado en datos demográficos solo considera las características del usuario en sí, mientras que el mecanismo de filtrado colaborativo basado en el usuario calcula la similitud del usuario en función de los datos de preferencias históricas del usuario. Su suposición básica es que los usuarios a quienes les gustan elementos similares pueden. tener gustos y preferencias iguales o similares.
El filtrado colaborativo basado en elementos es similar al filtrado colaborativo basado en usuarios. Utiliza la información de preferencias de todos los usuarios para encontrar la similitud entre los elementos y luego combina los elementos según la información de preferencias históricas del usuario. Recomendado a los usuarios.
Comparación entre la recomendación de filtrado colaborativo basada en elementos y la recomendación basada en contenido:
Similitud: ambas se basan en la predicción y recomendación de similitud de elementos, pero el método de cálculo de similitud es diferente ; p>
p>
La diferencia: el primero se infiere de las preferencias históricas del usuario, mientras que el segundo se basa en la información de características de atributos del artículo en sí.
¿Cómo elegir entre estrategias de filtrado colaborativo basadas en usuarios y basadas en elementos?
En comparación con las recomendaciones basadas en usuarios, las recomendaciones basadas en proyectos se utilizan más ampliamente y tienen mejor escalabilidad y rendimiento de algoritmo. Debido a que los proyectos generalmente crecen a un ritmo más lento, el desempeño cambia poco. La desventaja es que no puede proporcionar resultados de recomendaciones personalizados. Cuando la relación entre el número de usuarios y el número de elementos es diferente, los principales métodos de recomendación elegidos son diferentes. El número de elementos gt; el número de usuarios, se prefiere el filtrado colaborativo basado en usuarios; el número de elementos lt; el número de usuarios, se prefiere el filtrado colaborativo basado en elementos.
El número de proyectos es mucho menor que el número de usuarios y el número y la similitud de los proyectos son relativamente estables. Al mismo tiempo, el mecanismo basado en proyectos es más en tiempo real que el de usuario; mecanismo basado.
Pero este no es el caso en todos los escenarios. En algunos sistemas de recomendación de noticias, la cantidad de elementos, es decir, las noticias pueden ser mayores que la cantidad de usuarios, y las noticias se actualizan muy rápidamente, por lo que su similitud sigue siendo inestable. Por lo tanto, la elección de la estrategia de recomendación en realidad tiene mucho que ver con el escenario de aplicación específico.
Debido a que el mecanismo de recomendación basado en el filtrado colaborativo no requiere un modelado estricto de elementos o usuarios, compara directamente la similitud entre elementos y no requiere descripciones de elementos comprensibles por máquina. Las recomendaciones calculadas mediante este método son abiertas y pueden aprovechar plenamente la experiencia de otros, lo que puede ayudar a los usuarios a descubrir posibles preferencias de interés. Por lo tanto, ahora también es un mecanismo de recomendación ampliamente utilizado.
La desventaja es que el núcleo se basa en datos históricos, por lo que existe un problema de "inicio en frío" para nuevos proyectos y nuevos usuarios, la precisión de las recomendaciones depende de la magnitud de los datos de preferencias históricas del usuario y; el número total de usuarios. ;
Las recomendaciones basadas en reglas de asociación son más comunes en el comercio electrónico y tienen una mayor tasa de conversión. El significado real es que los usuarios que compran algunos productos están más inclinados a comprar otros productos. El objetivo principal de la recomendación basada en reglas de asociación es descubrir reglas de asociación entre diferentes productos, es decir, los conjuntos de combinaciones de productos comprados por muchos usuarios al mismo tiempo. Los productos de estos conjuntos pueden recomendarse entre sí.
Al calcular el contenido que les puede gustar a los usuarios, lo que se debe hacer en el tercer paso es cómo mostrárselo a los usuarios para mejorar aún más la experiencia del usuario y aumentar el consumo secundario del contenido recomendado.
Entre muchas aplicaciones, cada una tiene varias páginas y cada página tiene una variedad de ubicaciones recomendadas. Filtrar según el posicionamiento funcional del producto, los hábitos operativos del usuario, la relevancia del comportamiento del usuario y otras dimensiones. Sólo colocando contenido adecuado en una ubicación más adecuada, mejorando continuamente los retratos de los usuarios y ajustando las estrategias de entrega en función del comportamiento de uso del usuario se puede garantizar la eficiencia del usuario.
En el Double Eleven que acaba de pasar, cada uno de nosotros puede tener una imagen de banner de la aplicación Tmall completamente diferente. Debido a que solo necesita ingresar el tipo de tema, el sistema de diseño de inteligencia artificial "Luban" de Alibaba generará decenas de miles de materiales diferentes y los presentará de forma personalizada según el tema y las características del consumidor, logrando realmente identificar a miles de personas y miles de rostros. Esto también duplicó con creces la tasa de clics en los recursos.
Hay muchos métodos de recomendación. Se aplicarán diferentes mecanismos de recomendación a diferentes escenarios y también habrá lagunas en la precisión de las recomendaciones. Por lo tanto, generalmente al construir un sistema de recomendación, no se utiliza simplemente un determinado mecanismo de recomendación, sino que a menudo se combinan varios métodos para compensar las deficiencias de cada uno, logrando así mejores resultados de recomendación.
Después de saber qué tipo de contenido se recomienda a los usuarios, a medida que pasa el tiempo, habrá cada vez más contenido que satisfaga las preferencias del usuario. Este contenido debe combinarse con la dimensión del tiempo, la popularidad del contenido y más. Solo filtrando y clasificando en la dimensión natural y colocándolo en la ubicación correcta el usuario puede resolver el problema sin darse cuenta.
Hoy en día, cuando la información es enorme, el desarrollo de la inteligencia artificial ha comenzado a explotar. Las soluciones más avanzadas requieren aprendizaje y exploración continuos. Creo que en el futuro, cada ROM de teléfono móvil será una gran aplicación, que se puede abrir hasta cierto punto. La información utilizada en cualquier software del teléfono móvil se puede compartir y convertirse en datos para ayudar a los usuarios. en un verdadero asistente móvil.