¿Qué significa el análisis de sentimientos basado en el aprendizaje automático?
Tome las siguientes características semánticas como ejemplo:
Análisis de sentimiento de aprendizaje automático basado en características semánticas
El análisis de sentimiento basado en características semánticas ha sido estudiado por personas anteriores. Esto se puede hacer mediante la comparación del diccionario de sentimientos, pero al aplicar el aprendizaje automático en este sentido, la precisión será mayor.
Tome un proyecto en el que participé como ejemplo para resumir los puntos técnicos relevantes.
El trasfondo es: analizar si los comentarios de los usuarios son positivos o negativos, es decir, si los comentarios de los usuarios son positivos o negativos.
Los pasos específicos son:
1. Utilice etiquetas de clase para realizar anotaciones manuales supervisadas de texto. Por ejemplo, si hay 5000 datos de revisión, marcamos 1000 de ellos como positivos y luego seleccionamos otros 1000 para marcar como negativos. Positivos y negativos son las llamadas etiquetas de clase.
2. Seleccionar funciones. Seleccione todas las características positivas por palabra de los datos de reseñas positivas. De manera similar, todas las características negativas se seleccionan palabra por palabra de los datos de reseñas negativas. Por ejemplo, "este juego es muy divertido" -gt; "este" -gt; "juego" -gt; "muy" -gt; "este juego" También puedes usar combinaciones de dos palabras con "muy divertido" como palabras destacadas y "este juego" y "muy divertido" como palabras destacadas.
3. Reducción de la dimensionalidad de las funciones, reduciendo el número de funciones. Por ejemplo, "este juego" en "este juego es divertido" no necesita ser una característica, porque "divertido" o "muy divertido" ya determina si la reseña es "divertida" o "muy divertida". "
3.
4. Utilice funciones para convertir el texto del corpus en representaciones.
5. Cuente el número de apariciones de todas las funciones y ordénelas al revés orden
6. Seleccione algunas características mejor clasificadas de los resultados anteriores como características de evaluación final
7. clasificador.
8. Utilice datos de prueba para comprobar la precisión del clasificador.
Dividimos los datos en dos partes: el conjunto de desarrollo y el conjunto de prueba, y utilizamos los datos. en el conjunto de desarrollo para entrenar el algoritmo de clasificación, obtenga el clasificador; luego use el clasificador para clasificar los datos en el conjunto de prueba y proporcione la etiqueta de la predicción de clasificación, compare la diferencia entre la etiqueta de clasificación y la etiqueta obtenida mediante anotación manual; y calcular la precisión.