¿Qué es el algoritmo de la máquina de vectores de soporte?
La máquina de vectores de soporte (inglés: máquina de vectores de soporte, a menudo abreviada como SVM, también conocida como red de vectores de soporte) es un modelo de aprendizaje supervisado y algoritmos de aprendizaje relacionados que se utilizan en análisis de clasificación y regresión para analizar datos.
SVM es un clasificador escaso y robusto que utiliza una función de pérdida de bisagra para calcular el riesgo empírico y agrega un término de regularización al sistema de solución para optimizar el riesgo estructural.
SVM puede realizar una clasificación no lineal a través del método del kernel y es uno de los métodos de aprendizaje del kernel más comunes.
SVM se propuso en 1964 y se desarrolló rápidamente después de la década de 1990, derivando una serie de algoritmos mejorados y ampliados y aplicándose a problemas de reconocimiento de patrones como el reconocimiento de retratos y la clasificación de texto.
Motivación
¿No se pueden separar categorías; H2? ¿Se puede, pero solo con una pequeña brecha?
Clasificar datos es un problema clave en el aprendizaje automático. Una tarea común. Supongamos que algunos puntos de datos determinados pertenecen a una de dos categorías, y nuestro objetivo es determinar a qué categoría pertenecerá un nuevo punto de datos. Para las máquinas de vectores de soporte, los puntos de datos se tratan como vectores p-dimensionales y queremos saber si es posible separar estos puntos usando un hiperplano (p-1)-dimensional.
Esto es lo que se llama clasificador lineal. Puede haber muchos hiperplanos que puedan clasificar los datos. Una elección razonable para el mejor hiperplano es aquel que separa las dos clases por el margen máximo.
Por lo tanto, queremos elegir un hiperplano que tenga la mayor distancia desde los puntos de datos más cercanos en ambos lados. Si tal hiperplano existe, se denomina hiperplano de margen máximo y el clasificador lineal definido por él se denomina clasificador de margen máximo o perceptrón de estabilidad óptima.
Aplicaciones
1. En la clasificación de texto e hipertexto, ya sea mediante un método inductivo o un método de inferencia directa, el número de muestras con etiquetas de clase requeridas se puede reducir significativamente.
2. Se utiliza para la clasificación de imágenes. Los resultados experimentales muestran que después de tres o cuatro rondas de comentarios relevantes, las máquinas de vectores de soporte pueden lograr una precisión de búsqueda mucho mayor que los esquemas tradicionales de optimización de consultas. Lo mismo se aplica a los sistemas de segmentación de imágenes como SVM que utilizan una versión mejorada del enfoque privilegiado sugerido por Vapnik.
3. Se utiliza para el reconocimiento de fuentes escritas a mano.
4. Utilizado para la clasificación de proteínas en medicina, más del 90% de los compuestos se pueden clasificar correctamente.
La prueba de permutación basada en peso de máquinas de vectores de soporte se considera un mecanismo para interpretar modelos de máquinas de vectores de soporte.
Los pesos de las máquinas de vectores de soporte también se han utilizado para explicar modelos SVM anteriores. La interpretación post hoc de modelos de máquinas de vectores de soporte para determinar las características del modelo utilizado para la predicción es un área de investigación relativamente nueva que es de particular importancia en las ciencias biológicas.
¿Las referencias anteriores? Enciclopedia Baidu: máquina de vectores de soporte