Cuanto más grande sea el modelo SVM, mayor será el tiempo de predicción.
1) Selección de la escala experimental, determinando el número de conjuntos de entrenamiento, el número de conjuntos de prueba y la proporción de los dos; parámetros; 3) Experimento de normalización de datos; 4) determinación de la función del núcleo; La selección de parámetros es muy importante para el rendimiento de SVM. Para la función del kernel en este artículo, se utiliza la función del kernel RBF. Para la función del kernel RBF, los parámetros de SVM incluyen el parámetro de compromiso C, el ancho del kernel C y el. parámetro de insensibilidad E. En la actualidad, no existe un modelo internacional unificado para la selección de parámetros de función del núcleo en el método SVM. En otras palabras, la selección de los parámetros óptimos del algoritmo SVM solo puede depender de la experiencia, comparaciones experimentales, búsquedas a gran escala y cruces. validaciones. En aplicaciones prácticas, a menudo establecemos un pequeño número positivo como valor de E. Este artículo primero toma varios valores dentro de un cierto rango de C y C para el entrenamiento, establece el rango aproximado de cada valor de parámetro y luego usa la retención. método Un método para seleccionar valores de parámetros
El modelo SVM de orden más alto de series de tiempo de precios de acciones
Las acciones son series de tiempo A través del análisis de series de tiempo, sabemos que los precios de las acciones tienen. las siguientes características. Del análisis de series de tiempo, sabemos que el precio de las acciones tiene un desfase temporal y características posteriores, y el precio de las acciones del día no solo está relacionado con varias características del día, sino también con los precios de las acciones y las características del día anterior. pocos días. Por lo tanto, es necesario combinar los precios de las acciones de los días anteriores. El precio de las acciones y las características se consideran variables independientes. El principio básico para determinar el orden más alto es comenzar a modelar el sistema desde un orden inferior y luego aumentar gradualmente el orden del modelo y utilizar la prueba F para identificar estos modelos y determinar el orden más alto n, de modo que sea más objetivo. reflejan el precio de las acciones. Los pasos de operación específicos son los siguientes: Supongamos que un modelo de regresión de múltiples entradas y salida única tiene N muestras, una variable dependiente (precio de las acciones), m-1 variables independientes (características) y un sistema de ajuste de modelo SVM recursivo de bajos niveles. de orden a orden superior (aquí el método de orden superior utiliza el precio de las acciones de ayer como variable independiente y las características alcanzan el orden superior al mismo tiempo), y el método de prueba F se utiliza para juzgar si el aumento en el orden del modelo es apropiado para dos modelos SVM adyacentes [7]. La prueba F se aplica secuencialmente a dos modelos SVM adyacentes para determinar si es apropiado un aumento en el orden del modelo [7]. Para dos modelos adyacentes SVM (n) y SVM (n+ 1), existe el siguiente estadístico Fi: Fi = QSVR (n) - QSVR( n+1)QSVR (n)1N - m n - (m -1)mi = 1,2,,,n(1), obedecen respectivamente a la distribución F de grados de libertad m y (N - m n - (m -1)), donde QSVR (n) y QSVR( n+1) son SVR ( n ) y QSVR (n+1). son la suma de las diferencias al cuadrado de los residuos de SVR (n) y QSVR (n+1) respectivamente. Si Fi < F (?, m, N-m n- (m-1)), entonces el modelo SVM (n) es adecuado. ; de lo contrario, continúe expandiéndose.
Detección de características flotantes hacia adelante
Después de determinar el orden más alto del modelo anterior, aunque se determina el modelo SVM de orden n, es decir, n características, algunas características tienen Debido a un cierto impacto en la precisión de la predicción del modelo, este artículo utiliza el algoritmo de detección de características flotantes hacia adelante y el método de dejar uno fuera basado en SVM para descartar características que tienen un impacto beneficioso en la mejora de la precisión de la predicción. Sea B = {xj: j=1,2,,, k} representa el conjunto completo de características, Am representa el subconjunto de características compuesto por m características en B, y las funciones de evaluación MSE (Am) y MSE (Ai) se conocen i = 1,2,, m -1 valor.
El algoritmo de detección de características flotantes hacia adelante utilizado en este artículo es el siguiente [9]: 1) Suponga que m = 0, A0 es el conjunto vacío, use el método de detección de características hacia adelante para encontrar dos características para formar el subconjunto de características Am (m = 2 2) Utilice el método de selección de características directas para seleccionar la característica xm +1 del subconjunto de características no seleccionadas (B -Am) para obtener el subconjunto Am+1 3) Si el número de iteraciones alcanza el valor predeterminado, salga; de lo contrario, ejecute 4; 4) Seleccione La característica menos importante en el subconjunto de características Am+1. Si xm+1 es la característica menos importante, es decir, para cualquier jXm + 1, J (Am + 1- xm+1)FJ(Am + 1- xj) se cumple, entonces sea m = m + 1 y devuelva 2) (Debido a que xm+1 es la característica menos importante, no hay necesidad de excluir las características originales de Am si la característica menos importante es xr( r =1,2,,, m ) y MSE (Am+1- xr); ) < MSE (Am) está establecido, luego excluye xr y hace que A'm= Am+1- xr si m =2, sea Am= A'm, J (Am) = J (A'm), devuelve 2; ), De lo contrario, vaya al paso 5); 5) Encuentre la característica menos importante xs en el subconjunto de características A'm, si MSE (A'm- xs) EM SE (Am-1), entonces asuma Am= A'm. , MSE (Am) = MSE (A'm), devuelve 2); si M SE (A'm- xs) < M SE (Am-1), entonces A'm excluye xs y obtiene A'm-. 1= Am- xs, por lo tanto m = m -1; si m = 2, entonces sea Am= A'm, MSE(Am) = MSE(A'm), devuelva 2), de lo contrario vaya a 5). Las características finales seleccionadas se utilizarán para predicciones de modelado posteriores.
Indicadores de evaluación predictiva y modelos de referencia
La etapa de evaluación de los resultados del entrenamiento es verificar la capacidad de generalización del modelo entrenado. La llamada capacidad de generalización se refiere a la capacidad del modelo entrenado. a La capacidad de responder correctamente a muestras no presentes. Para evaluar la calidad del modelo, este artículo selecciona BPANN, el modelo de series de tiempo autorregresivo (CAR) multivariado y SVM sin orden superior ni filtrado de características como modelos de referencia. Tomando el error cuadrático medio (MSE) y el error porcentual absoluto medio (MAPE) como indicadores de evaluación, MSE y MAP se definen de la siguiente manera: M SE=E(yi- y^i)2n( 2)MAPE=E yi- y^| i | /yin( 3) donde yi es el valor verdadero, y^i es el promedio de los dos modelos, y MAPE=E| yi- y^i| i es el promedio de los dos modelos El promedio de dos modelos, mientras que MAPE es el promedio de dos modelos. ) donde yi es el valor verdadero, y^i es el valor predicho y n es el número de muestras predichas. Si los resultados de MSE y MAPE son menores, significa que la capacidad de generalización del modelo de evaluación es más fuerte; de lo contrario, significa que su capacidad de generalización es peor.