Red de conocimiento informático - Material del sitio web - Análisis de series temporales basado en SPSS (reimpreso de un gran dios)

Análisis de series temporales basado en SPSS (reimpreso de un gran dios)

Antecedentes de la aplicación:

Mediante el análisis de secuencias y predicciones razonables, podemos captar de antemano las tendencias de desarrollo futuras y proporcionar una base para la toma de decisiones corporativas. Este es el requisito previo para la toma de decisiones científicas.

Análisis de series temporales:

Una serie temporal es un conjunto de secuencias de datos dispuestas en orden temporal.

El análisis de series temporales es una técnica estadística que descubre los patrones cambiantes de este conjunto de datos y los utiliza para la predicción.

Herramientas de análisis:

SPSS

Caso práctico: utilizar datos históricos para predecir datos futuros implica la práctica más sencilla. Se centra en el método, por grande que sea. los datos son complejos, los métodos son los mismos.

Si se conocen las ventas mensuales de años anteriores, predecir las ventas futuras.

Primero, introduzca el método de análisis de series de tiempo.

El método de análisis de series de tiempo tiene tres características básicas:

Se supone que la tendencia de desarrollo de las cosas se extenderá hacia el futuro

Los pronósticos se basan en datos irregulares

No se considera la relación causal del desarrollo de las cosas

No todas las series de tiempo deben contener cuatro factores. Por ejemplo, una serie en años puede no incluir cambios estacionales.

Suele haber dos combinaciones de cuatro factores:

Los cuatro factores son independientes entre sí, es decir, la serie temporal es una superposición directa de los cuatro factores, que puede ser expresado como un modelo aditivo: Y=T S C I

Cuatro factores interactúan. En otras palabras, la serie de tiempo es el resultado de la integración de cuatro factores, que pueden representarse mediante un modelo multiplicativo: Y = T * S * C * I

Entre ellos, el valor y el largo- La tendencia del término de la serie de tiempo original se puede expresar mediante expresión de valor absoluto; los cambios estacionales, los cambios cíclicos y los cambios irregulares se pueden expresar como valores relativos (cambios porcentuales).

2. Método de descomposición estacional

Cuando predecimos una serie de tiempo, debemos considerar los cuatro factores anteriores desde la perspectiva de la descomposición de la serie de tiempo.

¿Por qué deberíamos desglosar estos cuatro factores?

Después de la descomposición, se puede superar la influencia de otros factores y solo se puede considerar la influencia de un factor en la serie temporal.

Después de la descomposición, también se puede analizar la interacción entre ellos y su impacto combinado en la serie temporal.

Después de eliminar estos factores, las comparaciones entre series temporales se pueden hacer mejor, reflejando así de manera más objetiva el desarrollo y los patrones de cambio de las cosas.

Las series descompuestas se pueden utilizar para construir modelos de regresión, mejorando así la precisión de las predicciones.

¿Es necesario descomponer todas las series temporales según estos cuatro factores?

Por lo general, consideraríamos la descomposición estacional, que elimina la variación estacional de la serie temporal original y luego genera una serie de los tres factores restantes para el análisis posterior.

¿Por qué considerar únicamente la descomposición estacional?

La tendencia a largo plazo de las series temporales refleja la ley del desarrollo y es el foco de la investigación.

Debido al largo ciclo, los cambios cíclicos pueden considerarse como un reflejo de la tendencia; tendencia a largo plazo;

Los cambios irregulares generalmente no se analizan por separado porque son difíciles de medir.

A veces, el modelo de pronóstico juzga erróneamente los cambios estacionales como cambios irregulares, lo que reduce la precisión del pronóstico del modelo.

En resumen: cuando la serie temporal tiene características de cambio estacional, al pronosticar valores de las divisas, el primer paso es desglosar los factores estacionales.

Pasos:

Determinar la variable de fecha: primero determinar el tiempo de la secuencia y luego analizar sus características temporales.

Comprender la tendencia de la secuencia: es decir, el diagrama de secuencia, determinar si es multiplicación o suma

Descomponer factores estacionales

Construir un modelo

Interpretar los resultados del análisis

Pronóstico

1. Definición de variables de etiquetado de fecha

La característica de una serie temporal es que los datos se organizan en el orden de puntos temporales, es decir, antes del análisis.

SPSS necesita conocer la definición temporal de la secuencia antes de poder analizar las características temporales.

Seleccione según el formato de los datos de origen e ingrese el valor específico en el primer caso.

En este punto, se generarán tres nuevas variables en el archivo fuente.

2. Comprenda la tendencia de desarrollo de la serie

Después de completar la definición de las variables de etiqueta de fecha, debe comprender la tendencia de desarrollo de la serie temporal para poder elegir un modelo apropiado. . Es decir, a través del diagrama de secuencia, determine si el modelo es un modelo multiplicativo o un modelo aditivo.

La variable es "datos de ventas" y la etiqueta de la línea de tiempo es "FECHA-", que es nuestra hora personalizada.

Diagrama de secuencia de datos de ventas

¿Cómo determinar si el modelo es un modelo multiplicativo o un modelo aditivo basado en el diagrama de secuencia?

Si las fluctuaciones estacionales de la serie aumentan con el tiempo, se recomienda un modelo multiplicativo.

Si las fluctuaciones estacionales de la serie se mantienen esencialmente constantes, se recomienda un modelo aditivo.

Este ejemplo es claro: a medida que los datos de ventas experimentan fluctuaciones estacionales crecientes con el tiempo, un modelo multiplicativo será más preciso.

3. Factorización estacional

La variable son "datos de ventas". Según el diagrama de secuencia, sabemos que el modelo de series de tiempo es un modelo multiplicativo.

Se le pedirá que genere cuatro nuevas variables

ERR (Serie de errores): la serie que queda después de que los factores estacionales, las tendencias a largo plazo y los cambios cíclicos se hayan eliminado de un serie de tiempo, es decir una secuencia que consta de variaciones irregulares en la secuencia original.

SAS (Serie Ajustada Estacionalmente): Serie modificada que elimina factores estacionales de la serie original.

SAF (Factor Estacional): Es el factor estacional descompuesto de la secuencia. Los valores de las variables se repiten según el ciclo estacional, que en este caso es de 12 meses, por lo que estos factores estacionales no se repiten cada 12 meses.

STC (tendencia a largo plazo y tendencia de cambio cíclico): Esta es la secuencia original compuesta por tendencia a largo plazo y cambio cíclico.

Como se muestra en la figura, el ciclo es de 12 meses y los factores estacionales se repiten cada 12 meses.

¿En qué se diferencia la factorización estacional completa de la secuencia original?

Utilice el diagrama de secuencia de regresión para comparar la secuencia original y tres secuencias con factores estacionales eliminados (secuencia de error, secuencia de corrección de factores estacionales, secuencia de ignorancia a largo plazo y secuencia de cambio cíclico).

Para dibujar cuatro diagramas de secuencia, se necesitan cuatro variables:

Secuencia original: use la variable "Datos de ventas"

Secuencia de error: use la variable "; ERR" ;

Series desestacionalizadas y corregidas por factores estacionales: utilizar la variable "SAS";

Series tendenciales y cíclicas de largo plazo: utilizar la variable "STC";

Línea Azul: Serie original

Línea morada: Serie de tendencia y ciclo de largo plazo

Marrón claro: Serie desestacionalizada

Marrón claro: Estacionalmente serie ajustada

Línea verde: serie de error (cambios irregulares)

Dado que la serie de error es muy pequeña, la tendencia a largo plazo y la serie de cambio cíclico (cambios cíclicos de tendencia a largo plazo) son diferentes de las series de corrección estacional (cambios cíclicos de tendencia a largo plazo, cambios irregulares), es decir, los errores) pueden coincidir en gran medida.

Otro gráfico de "Factor Estacional SAF":

Por ser un gráfico de "Factor Estacional", solo existe una variable "Factor Estacional SAF". "

Podemos ver que el factor estacional sigue un ciclo de 12 meses, primero cayendo, luego subiendo hasta el primer pico, luego cayendo ligeramente y luego mostrando una evidente tendencia ascendente. En el séptimo alcanza su punto máximo cada mes, luego cae hasta el último mes del ciclo y luego ingresa al segundo ciclo.

Mediante la descomposición estacional de la secuencia original, podemos comprender mejor las características de tiempo contenidas en la secuencia original. Eligiendo así el modelo apropiado para la predicción.

3. Método de modelado experto

Hay cuatro pasos en el pronóstico de series de tiempo:

Dibujar gráficos de series de tiempo y observar tendencias

Analizar la estacionariedad de la serie y realizar un procesamiento de suavizado

Analizar el modelado de series de tiempo

Evaluación y predicción del modelo

El punto clave de la suavidad son todas las estadísticas de la serie. series de tiempo Las características no cambian con el tiempo.

Para una serie temporal estacionaria, tiene las siguientes características:

La media y la varianza no cambian con el tiempo

El coeficiente de autocorrelación solo está relacionado con la intervalo de tiempo, e Independiente del tiempo

El coeficiente de autocorrelación es el coeficiente de correlación de diferentes períodos de tiempo en la serie en estudio, es decir, una serie de coeficientes de correlación del tiempo actual de una serie de tiempo y. Se calculan diferentes períodos de retraso.

Método de suavizado-método de diferencia.

La diferencia se refiere a la diferencia entre dos períodos adyacentes en la secuencia.

Diferencia de primer nivel = Yt-Yt-1

Diferencia de segundo nivel = (Yt-Yt-1)-(Yt-1-Yt-2)

El proceso de suavizado preciso se manejará automáticamente mediante métodos de modelado expertos, y solo tendremos que tararear las diversas diferencias que atraviesa la secuencia individualmente en función de los resultados del modelo.

Acción de análisis de series temporales:

Para analizar todas las variables, seleccione Datos de ventas.

Modelado experto: condición, marque "El modelado experto considera el modelo estacional".

Marque Predicciones para generar predicciones y guardar el modelo.

Interpretación de los resultados del análisis de series de tiempo

La tabla muestra el modelo de serie de tiempo óptimo y sus parámetros obtenidos después del análisis. El tiempo óptimo U es ARIMA (0, 1, 1) (. 0, 1, 1)

Modelo de media móvil autorregresiva ARIMA (P, D, Q) (P, D, Q)

p: Serie después de excluir los cambios estacionales Los rezagos del cambio estacional período p, generalmente 0 o 1, y rara vez es mayor que 1;

d: el cambio estacional va por detrás del período p de la serie después de excluir los cambios estacionales, generalmente 0 o 1, mayor que 1 es raro: el diferencia de orden d de la serie después de excluir los cambios estacionales, generalmente el valor es 0, 1 o 2

q: el promedio móvil de tiempo q de la serie después de excluir los cambios estacionales, generalmente el valor es 0; o 1, y los valores mayores que 2 son raros;

P, D y Q representan respectivamente ARIMA (p, d, q) que contiene secuencias de cambios estacionales (P, D, Q). Representa cambios en una serie que contiene cambios estacionales.

Por lo tanto, este ejemplo puede interpretarse como un modelo de serie temporal, que se construye combinando dos modelos con primeras diferencias y medias móviles de una serie que elimina la variación estacional y una serie que incluye la variación estacional, respectivamente. .

Esta tabla se centra en evaluar el ajuste del modelo mediante R cuadrado o R cuadrado estacionario, y comparar estadísticas para encontrar el modelo óptimo en el caso de múltiples modelos.

El R cuadrado suavizado es más informativo, igual a 32,1, que es un ajuste promedio porque las variables originales tienen variaciones estacionales.

Esta tabla proporciona estadísticas adicionales que se pueden utilizar para evaluar el ajuste de un modelo de series temporales.

Aunque el R cuadrado suavizado es sólo 32,1, la significancia del estadístico "Young-Box Q(18)" es P=0,706, que es mayor que 0,05 (donde Pgt; 0,05 es el resultado esperado ), por lo que se acepta Si se excede la hipótesis nula, se puede considerar que los residuales de la secuencia se ajustan a la distribución aleatoria, y no existen valores atípicos, lo que también refleja que el ajuste de los datos es aceptable.

Pronóstico de aplicación de serie temporal:

El año futuro es diciembre de 2016, ingresado manualmente.

Esta es la tendencia de ventas para el próximo año.

Si desea ver la tendencia prevista a nivel mundial, puede conectar la tendencia de este año con datos anteriores.

Las variables en este momento deben ser "Cantidad de ventas original" y "Ventas previstas para 2016". Cantidad" ".

Los resultados son los siguientes:

También puedes ver los valores concretos en la tabla: