Red de conocimiento informático - Aprendizaje de código fuente - Algoritmos específicos para análisis de series temporales

Algoritmos específicos para análisis de series temporales

Con el desarrollo de la teoría de procesos aleatorios y la estadística matemática, se estudian secuencias de datos aleatorios que se ajustan a las leyes estadísticas para resolver problemas prácticos. Debido a que en la mayoría de los problemas los datos aleatorios se organizan en orden cronológico, se denomina serie de tiempo. Incluye análisis estadístico general (como análisis de autocorrelación, análisis de espectro, etc.), modelado e inferencia estadísticos, así como predicción, control y filtrado optimizados de secuencias aleatorias. El análisis estadístico clásico supone que las series de datos son independientes, mientras que el análisis de series de tiempo se centra en las interdependencias entre las series de datos. Este último es en realidad un análisis estadístico del proceso estocástico de indicadores discretos, por lo que también puede considerarse como una parte integral de las estadísticas del proceso estocástico. Por ejemplo, use x (t) para representar la precipitación en un área determinada en el mes t, {x (t), t = 1, 2, ...} es una serie de tiempo. Para t = 1, 2,..., T, los datos de lluvia x (1), x (2),..., x (T) se registran mensualmente, lo que se denomina secuencia de muestra de longitud T. Luego se puede utilizar el análisis de series de tiempo para predecir la precipitación x(T+l) para meses futuros (l=1, 2,...). El análisis de series de tiempo se utilizó en los pronósticos económicos antes de la Segunda Guerra Mundial. Durante y después de la Segunda Guerra Mundial, el análisis de series temporales se utilizó más ampliamente en campos como la ciencia militar, la ciencia espacial y la automatización industrial.

En términos de métodos matemáticos, el análisis estadístico de secuencias aleatorias estacionarias (ver proceso estacionario) es más maduro en teoría y, por lo tanto, constituye la base del análisis de series temporales.

El análisis en el dominio de la frecuencia puede considerar las series de tiempo como la superposición de varias perturbaciones periódicas. El análisis en el dominio de la frecuencia consiste en determinar la distribución de la energía de vibración en cada ciclo. Esta distribución se denomina "espectro" o "espectro de potencia". ". Por lo tanto, el análisis en el dominio de la frecuencia también se denomina análisis del espectro. Un aspecto importante del análisis espectral es una estadística llamada periodograma de una secuencia. Cuando la secuencia contiene ciertos componentes periódicos, encontrar los períodos de estos componentes hasta el punto de valor máximo de I (ω) es uno de los contenidos importantes del análisis del espectro. En la secuencia de precipitaciones registrada mensualmente, se puede considerar que la secuencia x(t) contiene un componente determinista con un período de 12, por lo que la secuencia x(t) se puede expresar como, con un polo obvio en I(ω) de la valor periódico.

Cuando la densidad espectral de la función de distribución espectral F(λ) de la secuencia estacionaria es ?(λ) (es decir, el espectro de potencia), ?(λ) se puede estimar mediante (2π)- 1I(λ), es decir, ? (λ) es una estimación asintóticamente insesgada de ? (λ). Si desea encontrar ?(λ) (ver estimación puntual), puede utilizar un valor suave adecuado de I(ω) para estimar ?(λ). El método comúnmente utilizado es la estimación de ventana espectral, es decir, tomar el valor estimado. de ginseng (λ) como, donde wt(ω) se denomina función de ventana espectral. La estimación de la ventana espectral es uno de los métodos importantes en aplicaciones prácticas. Se puede obtener una estimación conjugada de la distribución espectral F(λ) directamente a partir de la integral de I(ω), es decir, estudiar las propiedades estadísticas de los diversos estimadores mencionados anteriormente y mejorar los métodos de estimación es una parte importante del análisis espectral. El propósito del análisis en el dominio del tiempo es determinar la interdependencia de los valores de una secuencia en diferentes momentos en el tiempo, o en otras palabras, determinar la estructura de correlación de la secuencia. Esta estructura se describe mediante la función de autocorrelación 0, 1,...), que es el valor de la función de autocovarianza de la serie, y m = Ex (t) es el valor medio de la serie estacionaria. Las siguientes ecuaciones se utilizan comúnmente para estimar m, γ(k), ρ(k): Comprender la estructura de correlación de una secuencia se denomina análisis de autocorrelación. Estudiar su colinealidad fuerte y débil y su distribución asintótica es una cuestión básica en el análisis de correlación. Análisis de modelos Desde la década de 1970, el modelo de series de tiempo más utilizado es el modelo estacionario de media móvil autorregresiva (conocido como modelo ARMA). Su forma es la siguiente: donde ε(t) es una secuencia aleatoria independiente e idénticamente distribuida con media cero y varianza σ2 es un parámetro del modelo que satisface: para todos los números complejos z, |z|≤; 1, z se cumple; p y q son el orden del modelo, que son números enteros no negativos. Entre ellos, cuando q = 0, el modelo anterior se denomina modelo autorregresivo; cuando p = 0, se denomina modelo de media móvil. Estimar estos parámetros y órdenes en función de valores muestrales de x(t) es el propósito del análisis estadístico de este tipo de modelo. Para secuencias estacionarias que satisfacen el modelo ARMA, la solución de problemas de control y predicción óptima lineal es relativamente simple, especialmente el modelo autorregresivo, que es más conveniente de usar.

G.U. Juul propuso el concepto de autorregresión estacionaria entre 1925 y 1930. En 1943, Η.B. y Α.Waldn propusieron respectivamente el concepto de autorregresión estacionaria. Mann y Α.Wald publicaron algunos resultados teóricos sobre los métodos estadísticos de este modelo y sus propiedades asintóticas. resultado. La investigación del análisis estadístico de los modelos ARMA generales no se desarrolló hasta después de la década de 1960. En particular, la estimación de los valores p, los valores q y su teoría asintótica aparecieron mucho más tarde. Además del modelo ARMA, existen otros estudios sobre análisis de modelos, entre los cuales la investigación sobre modelos lineales es más madura y todos están estrechamente relacionados con el análisis de modelos ARMA. Análisis de regresión Si la serie de tiempo x (t) se puede expresar como la suma del componente determinado φ (t) y el componente aleatorio ω (t), entonces, de acuerdo con los valores de muestra x (1), x (2) ..., x( T) Estimar φ(t) y analizar la regularidad estadística de ω(t) es un problema de análisis de regresión en el análisis de series de tiempo. La diferencia con el análisis de regresión clásico es que ω(t) generalmente no es independiente ni está distribuido idénticamente, por lo que se debe involucrar más conocimiento de los procesos estocásticos. Cuando φ(t) es una combinación lineal desconocida de un número limitado de funciones conocidas, es decir, ω(t) es una secuencia estacionaria con un valor medio de cero, α1, α2,..., αs son parámetros desconocidos, φ1 (t), φ2 (Cuando t),...,φs (t) son funciones conocidas, el modelo anterior se denomina modelo de regresión lineal y el análisis estadístico de este modelo se ha estudiado en profundidad en "Análisis estadístico". El ejemplo de lluvia anterior se puede describir utilizando este tipo de modelo. El análisis de regresión incluye: cuando se conoce la ley estadística de ω(t), estimar los parámetros α1, α2,..., αs y predecir el valor de x(T+l); Cuando se desconoce la ley, es necesario estimar los parámetros anteriores y realizar análisis estadísticos sobre ω(t), como análisis de espectro, análisis de modelado, etc. Entre ellos, un tema importante es: en una amplia gama de situaciones, demostrar que las estimaciones de mínimos cuadrados de α1, α2,..., αs tienen la misma coincidencia y normalidad asintótica que sus características de distribución de estimaciones insesgadas de varianza mínima lineal. La estimación de mínimos cuadrados j(1≤j≤s) no involucra la estructura de correlación estadística de ω(t), se calcula directamente a partir de los datos x(1), x(2),...,x(T) Al analizar series de tiempo, (t) también se puede derivar de ella para diversos análisis estadísticos para reemplazar el análisis de ω(t). La teoría también demuestra que, en condiciones apropiadas, esta sustitución tiene propiedades asintóticas satisfactorias. Dado que el verdadero valor de ω(t) no se puede medir directamente, estos resultados teóricos obviamente tienen un significado práctico importante. La investigación en esta área aún está evolucionando.

En el artículo Proceso estacionario se presentará información sobre la predicción, el control y el filtrado óptimos en el análisis de series de tiempo. En los últimos años, la investigación sobre el análisis de series temporales multidimensionales ha avanzado y se ha aplicado a la automatización de la producción industrial y al análisis económico. Además, el análisis estadístico de modelos no lineales y el análisis estadístico no paramétrico han atraído gradualmente la atención de la gente.