Monday, 9 October 2017

Media Móvil De Centrado Estacional


Promedio móvil Un promedio móvil es un método para suavizar series temporales promediando (con o sin pesos) un número fijo de términos consecutivos. El promedio de ldquomovesrdquo en el tiempo, en que cada punto de datos de la serie se incluye secuencialmente en el promedio, mientras que el punto de datos más antiguo en el lapso de la media se elimina. En general, cuanto más larga sea la duración del promedio, más lisa será la serie resultante. Los promedios móviles se utilizan para suavizar las fluctuaciones de las series temporales o para identificar los componentes de las series temporales, tales como la tendencia, el ciclo, la estacional, etc. Un promedio móvil reemplaza cada valor de una serie temporal por un promedio (ponderado) de p valores precedentes , El valor dado, y f los siguientes valores de una serie. Si p f se dice que el promedio móvil está centrado. Se dice que el promedio móvil es simétrico si está centrado, y si para cada k 1, 2, hellip. Pf El peso del k - ésimo valor precedente es igual al peso del k - ésimo siguiente. El promedio móvil no está definido para el primer p y los últimos f valores de la serie temporal. Para calcular la media móvil de esos valores, la serie debe ser retransmitida y pronosticada. Fuente: Grupo de trabajo sobre datos y presentación de metadatos para el Grupo de Trabajo de Estadísticas Económicas a Corto Plazo de la OCDE (STESWP), París, 2004 Concepto de estacionariedad Hipotéticamente, la observación actual puede depender de todas las observaciones anteriores. Este modelo autorregresivo es imposible de estimar ya que contiene demasiados parámetros. Sin embargo, si x t como una función lineal de todos los rezagos pasados, se puede demostrar que el modelo autorregresivo es equivalente a x t como una función lineal de sólo unos pocos choques pasados. En un modelo de media móvil, el valor actual de x t se describe como una función lineal de choque concurrente (error) y choques pasados ​​(errores). Introducción Los resultados del ajuste estacional se consideran estables si son relativamente resistentes a eliminar o agregar puntos de datos en cualquier extremo de la serie. La estabilidad es una de las propiedades clave de los resultados de SA. Si la adición o el retraso de algunas observaciones cambian sustancialmente la serie ajustada estacionalmente o el ciclo tendencial estimado, la interpretación de la serie con ajuste estacional sería poco fiable. Cuáles son las relaciones SI Las relaciones SI son valores de la componente estacional irregular (SI), calculada como la relación de la serie original a la tendencia estimada. En otras palabras, las relaciones SI son estimaciones de las series de tendencia. Los gráficos SI son útiles para investigar si los movimientos a corto plazo son causados ​​por fluctuaciones estacionales o irregulares. Esta gráfica es una herramienta de diagnóstico utilizada para analizar el comportamiento estacional, los patrones de vacaciones en movimiento, los valores atípicos y la identificación de las pausas estacionales en la serie. El software de ajuste estacional normalmente muestra la siguiente información sobre el modelo RegARIMA: Los criterios de selección del modelo (criterios de información) son medidas de la bondad relativa del ajuste de un modelo estadístico. En los programas de ajuste estacional se utilizan para seleccionar el orden óptimo del modelo RegARMIA. Para los criterios de información dados, el modelo preferido es el que tiene el valor mínimo de los criterios de información. Introducción En la iteración B (Tabla B7), la iteración C (Tabla C7) y la iteración D (Tabla D7 y Tabla D12) se extrae el componente de ciclo de tendencia de una estimación de la serie ajustada estacionalmente utilizando las medias móviles de Henderson. La longitud del filtro de Henderson es elegida automáticamente por X-12-ARIMA en un procedimiento de dos pasos. Implementación de la hoja de cálculo del ajuste estacional y suavizado exponencial Es sencillo realizar ajustes estacionales y ajustar modelos de suavizado exponencial utilizando Excel. Las imágenes y gráficos de pantalla que se muestran a continuación se toman de una hoja de cálculo que se ha configurado para ilustrar el ajuste estacional multiplicativo y el suavizado lineal exponencial en los siguientes datos de ventas trimestrales de Outboard Marine: Para obtener una copia del archivo de la hoja de cálculo, haga clic aquí. La versión de suavizado exponencial lineal que se utilizará aquí para propósitos de demostración es la versión de Brown8217s, simplemente porque puede implementarse con una sola columna de fórmulas y sólo hay una constante de suavizado para optimizar. Por lo general, es mejor usar la versión de Holt8217s que tiene constantes de suavizado separadas para nivel y tendencia. El proceso de pronóstico se desarrolla de la siguiente manera: (i) en primer lugar los datos se ajustan estacionalmente (ii) luego se generan pronósticos para los datos desestacionalizados a través de la suavización exponencial lineal y (iii) finalmente los pronósticos desestacionalizados son quotorasonalizados para obtener pronósticos para la serie original . El proceso de ajuste estacional se lleva a cabo en las columnas D a G. El primer paso en el ajuste estacional es calcular una media móvil centrada (realizada aquí en la columna D). Esto puede hacerse tomando el promedio de dos promedios de un año que son compensados ​​por un período entre sí. (Se necesita una combinación de dos promedios de compensación en lugar de un solo promedio para fines de centrado cuando el número de estaciones es par.) El siguiente paso es calcular la relación con el promedio móvil - ie. Los datos originales divididos por la media móvil en cada período - que se realiza aquí en la columna E. (Esto también se llama el componente quottrend-cyclequot del patrón, en la medida en que los efectos de tendencia y de ciclo de negocio podrían ser considerados como todo lo que Por supuesto, los cambios mensuales que no son debidos a la estacionalidad podrían ser determinados por muchos otros factores, pero el promedio de 12 meses suaviza sobre ellos en gran medida). El índice estacional estimado para cada estación se calcula primero haciendo un promedio de todas las proporciones para esa estación particular, que se hace en las células G3-G6 usando una fórmula de AVERAGEIF. Las relaciones medias se vuelven a escalar de modo que suman exactamente 100 veces el número de períodos en una estación, o 400 en este caso, lo que se hace en las células H3-H6. Debajo en la columna F, las fórmulas de VLOOKUP se utilizan para insertar el valor apropiado del índice estacional en cada fila de la tabla de datos, según el cuarto del año que representa. La media móvil centrada y los datos desestacionalizados terminan pareciendo esto: Obsérvese que la media móvil típicamente se parece a una versión más suave de la serie con ajuste estacional, y es más corta en ambos extremos. Otra hoja de trabajo en el mismo archivo de Excel muestra la aplicación del modelo de suavizado exponencial lineal a los datos desestacionalizados, empezando en la columna G. Un valor para la constante de suavizado (alfa) se introduce por encima de la columna de pronóstico (aquí en la celda H9) y Por comodidad se le asigna el nombre de rango quotAlpha. quot (El nombre se asigna mediante el mandato quotInsert / Name / Createquot). El modelo LES se inicializa estableciendo los dos primeros pronósticos igual al primer valor real de la serie ajustada estacionalmente. La fórmula utilizada aquí para la previsión de LES es la forma recursiva de una sola ecuación del modelo Brown8217s: Esta fórmula se introduce en la celda correspondiente al tercer período (aquí, celda H15) y se copia desde allí. Obsérvese que la previsión de LES para el período actual se refiere a las dos observaciones precedentes ya los dos errores de pronóstico precedentes, así como al valor de alfa. Por lo tanto, la fórmula de pronóstico en la fila 15 se refiere sólo a los datos que estaban disponibles en la fila 14 y anteriores. (Por supuesto, si deseamos usar el suavizado exponencial lineal simple en vez de lineal, podríamos sustituir la fórmula SES aquí en lugar. También podríamos usar Holt8217s en lugar de Brown8217s modelo LES, lo que requeriría dos columnas más de fórmulas para calcular el nivel y la tendencia Que se utilizan en la previsión). Los errores se calculan en la siguiente columna (aquí, columna J) restando las previsiones de los valores reales. El error cuadrático medio raíz se calcula como la raíz cuadrada de la varianza de los errores más el cuadrado de la media. En el cálculo de la media y la varianza de los errores en esta fórmula, se excluyen los dos primeros períodos porque el modelo no comienza realmente a pronosticar hasta el momento en que se calcula la media y la varianza de los errores en esta fórmula. El tercer período (fila 15 en la hoja de cálculo). El valor óptimo de alpha se puede encontrar cambiando manualmente alfa hasta que se encuentre el RMSE mínimo, o bien puede usar el quotSolverquot para realizar una minimización exacta. El valor de alfa que encontró el Solver se muestra aquí (alpha0.471). Por lo general, es una buena idea trazar los errores del modelo (en unidades transformadas) y también calcular y trazar sus autocorrelaciones a retrasos de hasta una temporada. Las correlaciones de error se calculan usando la función CORREL () para calcular las correlaciones de los errores con ellos mismos rezagados por uno o más períodos - los detalles se muestran en el modelo de hoja de cálculo . Aquí hay una gráfica de las autocorrelaciones de los errores en los primeros cinco retrasos: Las autocorrelaciones en los retornos 1 a 3 son muy cercanas a cero, pero el pico con retraso 4 (cuyo valor es 0,35) es ligeramente problemático. El proceso de ajuste estacional no ha sido completamente exitoso. Sin embargo, en realidad sólo es marginalmente significativo. 95 para determinar si las autocorrelaciones son significativamente diferentes de cero son más o menos 2 / SQRT (n-k), donde n es el tamaño de la muestra yk es el retraso. Aquí n es 38 y k varía de 1 a 5, por lo que la raíz cuadrada de - n-menos-k es de alrededor de 6 para todos ellos, y por lo tanto los límites para probar la significación estadística de las desviaciones de cero son más o menos - O-menos 2/6, o 0,33. Si se modifica el valor de alfa manualmente en este modelo de Excel, se puede observar el efecto sobre la serie temporal y las gráficas de autocorrelación de los errores, así como sobre el error cuadrático medio de raíz, que se ilustrará a continuación. En la parte inferior de la hoja de cálculo, la fórmula de pronóstico se quotbootrapeado en el futuro mediante la simple sustitución de los pronósticos de los valores reales en el punto en que se agotan los datos reales, es decir, Donde comienza el futuro. (En otras palabras, en cada celda donde se produzca un valor de datos futuro, se inserta una referencia de celda que apunta a la previsión hecha para ese período). Todas las otras fórmulas se copian simplemente desde arriba: Obsérvese que los errores para pronósticos de El futuro se calcula que es cero. Esto no significa que los errores reales sean cero, sino que simplemente refleja el hecho de que para propósitos de predicción estamos asumiendo que los datos futuros serán iguales a los pronósticos en promedio. Las previsiones de LES para los datos desestacionalizados se ven así: Con este valor particular de alfa, que es óptimo para predicciones de un período de anticipación, la tendencia proyectada es levemente ascendente, reflejando la tendencia local que se observó en los últimos 2 años más o menos. Para otros valores de alfa, se podría obtener una proyección de tendencia muy diferente. Por lo general, es una buena idea ver qué sucede con la proyección de tendencia a largo plazo cuando el alfa es variado, porque el valor que es mejor para pronósticos a corto plazo no será necesariamente el mejor valor para predecir el futuro más lejano. Por ejemplo, aquí está el resultado que se obtiene si el valor de alpha se establece manualmente en 0.25: La tendencia a largo plazo proyectada es ahora negativa en lugar de positiva Con un valor menor de alfa, el modelo está poniendo más peso en datos antiguos en Su estimación del nivel y tendencia actual y sus previsiones a largo plazo reflejan la tendencia a la baja observada en los últimos 5 años en lugar de la tendencia al alza más reciente. Este gráfico también ilustra claramente cómo el modelo con un valor menor de alpha es más lento para responder a los puntos de quotturning en los datos y por lo tanto tiende a hacer un error del mismo signo para muchos períodos en una fila. Sus errores de pronóstico de 1 paso son mayores en promedio que los obtenidos antes (RMSE de 34,4 en lugar de 27,4) y fuertemente positivamente autocorrelacionados. La autocorrelación lag-1 de 0,56 excede en gran medida el valor de 0,33 calculado anteriormente para una desviación estadísticamente significativa de cero. Como alternativa a la disminución del valor de alfa para introducir un mayor conservadurismo en los pronósticos a largo plazo, a veces se añade al modelo un factor quottrend de amortiguación para hacer que la tendencia proyectada se aplaste después de unos pocos períodos. El paso final en la construcción del modelo de predicción es el de la obtención de la razón de los pronósticos de LES, multiplicándolos por los índices estacionales apropiados. Por lo tanto, las previsiones reseasonalized en la columna I son simplemente el producto de los índices estacionales en la columna F y las previsiones desestacionalizadas de LES en la columna H. Es relativamente fácil calcular intervalos de confianza para los pronósticos de un paso adelante realizados por este modelo: primero Calcular el RMSE (error cuadrático-medio cuadrático, que es sólo la raíz cuadrada del MSE) y luego calcular un intervalo de confianza para el pronóstico ajustado estacionalmente sumando y restando dos veces el RMSE. (En general, un intervalo de confianza de 95 para un pronóstico de un período por delante es aproximadamente igual al punto de previsión más o menos dos veces la desviación estándar estimada de los errores de pronóstico, suponiendo que la distribución del error es aproximadamente normal y el tamaño de la muestra Es lo suficientemente grande, digamos, 20 o más. En este caso, el RMSE en lugar de la desviación estándar de la muestra de los errores es la mejor estimación de la desviación estándar de los futuros errores de pronóstico, ya que toma el sesgo, así como las variaciones aleatorias en cuenta. Para el pronóstico estacionalmente ajustado son entonces reseasonalized. Junto con el pronóstico, multiplicándolos por los índices estacionales apropiados. En este caso el RMSE es igual a 27.4 y la previsión desestacionalizada para el primer período futuro (Dec-93) es 273.2. De modo que el intervalo de confianza estacionalmente ajustado es de 273.2-227.4 218.4 a 273.2227.4 328.0. Multiplicando estos límites por Decembers índice estacional de 68,61. Obtenemos límites de confianza inferiores y superiores de 149,8 y 225,0 en torno al pronóstico del punto Dec-93 de 187,4. Los límites de confianza para los pronósticos más de un período por delante se ampliarán generalmente a medida que aumenta el horizonte de pronóstico, debido a la incertidumbre sobre el nivel y la tendencia, así como los factores estacionales, pero es difícil calcularlos en general por métodos analíticos. (La forma apropiada de calcular los límites de confianza para la previsión de LES es utilizando la teoría ARIMA, pero la incertidumbre en los índices estacionales es otra cuestión.) Si desea un intervalo de confianza realista para un pronóstico de más de un período, tomando todas las fuentes de Su mejor opción es utilizar métodos empíricos: por ejemplo, para obtener un intervalo de confianza para un pronóstico de dos pasos adelante, podría crear otra columna en la hoja de cálculo para calcular un pronóstico de 2 pasos adelante para cada período ( Iniciando el pronóstico de un paso adelante). A continuación, calcular el RMSE de los errores de pronóstico de 2 pasos adelante y utilizar esto como base para un intervalo de confianza de 2 pasos adelante. Moving media y modelos de suavizado exponencial Como un primer paso para ir más allá de los modelos de media, aleatoria y Modelos de tendencias lineales, patrones no estacionales y tendencias pueden extrapolarse usando un modelo de media móvil o de suavizado. La suposición básica detrás de los modelos de promedio y suavizado es que la serie temporal es localmente estacionaria con una media que varía lentamente. Por lo tanto, tomamos un promedio móvil (local) para estimar el valor actual de la media y luego usarlo como pronóstico para el futuro cercano. Esto puede considerarse como un compromiso entre el modelo medio y el modelo aleatorio-paseo-sin-deriva. La misma estrategia se puede utilizar para estimar y extrapolar una tendencia local. Una media móvil se denomina a menudo una versión quotomoldeada de la serie original porque el promedio de corto plazo tiene el efecto de suavizar los golpes en la serie original. Al ajustar el grado de suavizado (el ancho de la media móvil), podemos esperar encontrar algún tipo de equilibrio óptimo entre el rendimiento de la media y los modelos de caminata aleatoria. El tipo más simple de modelo de promediación es el. Promedio móvil simple (igualmente ponderado): El pronóstico para el valor de Y en el tiempo t1 que se hace en el tiempo t es igual al promedio simple de las observaciones m más recientes: (Aquí y en otros lugares usaré el símbolo 8220Y-hat8221 para permanecer en pie Para un pronóstico de la serie de tiempo Y hecho a la fecha más temprana posible posible por un modelo dado). Este promedio se centra en el período t (m1) / 2, lo que implica que la estimación de la media local tiende a quedar rezagada detrás del Valor real de la media local de aproximadamente (m1) / 2 periodos. Por lo tanto, decimos que la edad media de los datos en el promedio móvil simple es (m1) / 2 en relación con el período para el cual se calcula el pronóstico: es la cantidad de tiempo por el cual los pronósticos tenderán a rezagarse detrás de los puntos de inflexión en el datos. Por ejemplo, si está promediando los últimos 5 valores, las previsiones serán de aproximadamente 3 períodos tarde en la respuesta a los puntos de inflexión. Tenga en cuenta que si m1, el modelo de media móvil simple (SMA) es equivalente al modelo de caminata aleatoria (sin crecimiento). Si m es muy grande (comparable a la longitud del período de estimación), el modelo SMA es equivalente al modelo medio. Como con cualquier parámetro de un modelo de pronóstico, es habitual ajustar el valor de k para obtener el mejor valor de los datos, es decir, los errores de predicción más pequeños en promedio. He aquí un ejemplo de una serie que parece presentar fluctuaciones aleatorias alrededor de una media de variación lenta. En primer lugar, vamos a tratar de encajar con un modelo de caminata al azar, que es equivalente a una media móvil simple de un término: El modelo de caminata aleatoria responde muy rápidamente a los cambios en la serie, pero al hacerlo, recoge gran parte del quotnoisequot en el Los datos (las fluctuaciones aleatorias), así como el quotsignalquot (la media local). Si en lugar de eso intentamos una media móvil simple de 5 términos, obtendremos un conjunto de previsiones más suaves: El promedio móvil simple a 5 terminos produce errores significativamente menores que el modelo de caminata aleatoria en este caso. La edad promedio de los datos de esta previsión es de 3 ((51) / 2), de modo que tiende a quedar a la zaga de los puntos de inflexión en aproximadamente tres períodos. (Por ejemplo, parece haber ocurrido una recesión en el período 21, pero las previsiones no giran hasta varios periodos más tarde). Obsérvese que los pronósticos a largo plazo del modelo SMA son una línea recta horizontal, al igual que en la caminata aleatoria modelo. Por lo tanto, el modelo SMA asume que no hay tendencia en los datos. Sin embargo, mientras que las previsiones del modelo de caminata aleatoria son simplemente iguales al último valor observado, las previsiones del modelo SMA son iguales a un promedio ponderado de valores recientes. Los límites de confianza calculados por Statgraphics para los pronósticos a largo plazo de la media móvil simple no se amplían a medida que aumenta el horizonte de pronóstico. Esto obviamente no es correcto Desafortunadamente, no hay una teoría estadística subyacente que nos diga cómo los intervalos de confianza deberían ampliarse para este modelo. Sin embargo, no es demasiado difícil calcular estimaciones empíricas de los límites de confianza para las previsiones a más largo plazo. Por ejemplo, podría configurar una hoja de cálculo en la que el modelo SMA se utilizaría para pronosticar dos pasos adelante, tres pasos adelante, etc. dentro de la muestra de datos históricos. A continuación, podría calcular las desviaciones estándar de los errores en cada horizonte de pronóstico y, a continuación, construir intervalos de confianza para pronósticos a más largo plazo sumando y restando múltiplos de la desviación estándar apropiada. Si intentamos una media móvil sencilla de 9 términos, obtendremos pronósticos aún más suaves y más de un efecto rezagado: La edad promedio es ahora de 5 períodos ((91) / 2). Si tomamos una media móvil de 19 términos, la edad promedio aumenta a 10: Obsérvese que, de hecho, las previsiones están ahora rezagadas detrás de los puntos de inflexión en aproximadamente 10 períodos. Qué cantidad de suavizado es la mejor para esta serie Aquí hay una tabla que compara sus estadísticas de error, incluyendo también un promedio de 3 términos: El modelo C, la media móvil de 5 términos, produce el valor más bajo de RMSE por un pequeño margen sobre los 3 A término y 9 promedios, y sus otras estadísticas son casi idénticas. Por lo tanto, entre los modelos con estadísticas de error muy similares, podemos elegir si preferiríamos un poco más de capacidad de respuesta o un poco más de suavidad en las previsiones. El modelo de media móvil simple descrito anteriormente tiene la propiedad indeseable de que trata las últimas k observaciones por igual e ignora por completo todas las observaciones precedentes. (Volver al principio de la página.) Browns Simple Exponential Smoothing Intuitivamente, los datos pasados ​​deben ser descontados de una manera más gradual - por ejemplo, la observación más reciente debería tener un poco más de peso que la segunda más reciente, y la segunda más reciente debería tener un poco más de peso que la tercera más reciente, y pronto. El modelo de suavizado exponencial simple (SES) lo logra. Sea 945 una constante quotsmoothingquot (un número entre 0 y 1). Una forma de escribir el modelo es definir una serie L que represente el nivel actual (es decir, el valor medio local) de la serie, tal como se estimó a partir de los datos hasta el presente. El valor de L en el tiempo t se calcula recursivamente a partir de su propio valor anterior como este: Así, el valor suavizado actual es una interpolación entre el valor suavizado anterior y la observación actual, donde 945 controla la proximidad del valor interpolado al valor más reciente observación. El pronóstico para el siguiente período es simplemente el valor suavizado actual: Equivalentemente, podemos expresar el próximo pronóstico directamente en términos de previsiones anteriores y observaciones previas, en cualquiera de las siguientes versiones equivalentes. En la primera versión, la previsión es una interpolación entre la previsión anterior y la observación anterior: En la segunda versión, la siguiente previsión se obtiene ajustando la previsión anterior en la dirección del error anterior por una cantidad fraccionada de 945. es el error hecho en Tiempo t En la tercera versión, el pronóstico es una media móvil exponencialmente ponderada (es decir, descontada) con el factor de descuento 1-945: La versión de interpolación de la fórmula de pronóstico es la más simple de usar si está implementando el modelo en una hoja de cálculo: se ajusta en un Célula única y contiene referencias de celdas que apuntan a la previsión anterior, la observación anterior y la celda donde se almacena el valor de 945. Tenga en cuenta que si 945 1, el modelo SES es equivalente a un modelo de caminata aleatoria (sin crecimiento). Si 945 0, el modelo SES es equivalente al modelo medio, asumiendo que el primer valor suavizado se establece igual a la media. La edad promedio de los datos en el pronóstico de suavización exponencial simple es de 1/945 en relación con el período para el cual se calcula la predicción. (Esto no se supone que sea obvio, pero se puede demostrar fácilmente mediante la evaluación de una serie infinita.) Por lo tanto, el pronóstico promedio móvil simple tiende a quedar rezagado detrás de puntos de inflexión en aproximadamente 1/945 períodos. Por ejemplo, cuando 945 0.5 el retraso es 2 períodos cuando 945 0.2 el retraso es 5 períodos cuando 945 0.1 el retraso es 10 períodos, y así sucesivamente. Para una edad promedio dada (es decir, la cantidad de retraso), el simple suavizado exponencial (SES) pronosticado es algo superior a la predicción del promedio móvil simple (SMA) porque coloca relativamente más peso en la observación más reciente - i. e. Es un poco más sensible a los cambios ocurridos en el pasado reciente. Por ejemplo, un modelo SMA con 9 términos y un modelo SES con 945 0.2 tienen una edad promedio de 5 para los datos de sus pronósticos, pero el modelo SES pone más peso en los 3 últimos valores que el modelo SMA y en el modelo SMA. Otra ventaja importante del modelo SES sobre el modelo SMA es que el modelo SES utiliza un parámetro de suavizado que es variable continuamente, por lo que puede optimizarse fácilmente Utilizando un algoritmo quotsolverquot para minimizar el error cuadrático medio. El valor óptimo de 945 en el modelo SES de esta serie resulta ser 0.2961, como se muestra aquí: La edad promedio de los datos de esta previsión es de 1 / 0,2961 3,4 períodos, que es similar a la de un movimiento simple de 6 términos promedio. Los pronósticos a largo plazo del modelo SES son una línea recta horizontal. Como en el modelo SMA y el modelo de caminata aleatoria sin crecimiento. Sin embargo, tenga en cuenta que los intervalos de confianza calculados por Statgraphics ahora divergen de manera razonable y que son sustancialmente más estrechos que los intervalos de confianza para el modelo de caminata aleatoria. El modelo SES asume que la serie es algo más predecible que el modelo de caminata aleatoria. Un modelo SES es en realidad un caso especial de un modelo ARIMA. Por lo que la teoría estadística de los modelos ARIMA proporciona una base sólida para el cálculo de los intervalos de confianza para el modelo SES. En particular, un modelo SES es un modelo ARIMA con una diferencia no estacional, un término MA (1) y ningún término constante. Conocido también como modelo quotARIMA (0,1,1) sin constantequot. El coeficiente MA (1) en el modelo ARIMA corresponde a la cantidad 1-945 en el modelo SES. Por ejemplo, si se ajusta un modelo ARIMA (0,1,1) sin constante a la serie analizada aquí, el coeficiente MA estimado (1) resulta ser 0.7029, que es casi exactamente un menos 0.2961. Es posible añadir la suposición de una tendencia lineal constante no nula a un modelo SES. Para ello, basta con especificar un modelo ARIMA con una diferencia no estacional y un término MA (1) con una constante, es decir, un modelo ARIMA (0,1,1) con constante. Las previsiones a largo plazo tendrán entonces una tendencia que es igual a la tendencia media observada durante todo el período de estimación. No puede hacerlo junto con el ajuste estacional, ya que las opciones de ajuste estacional están deshabilitadas cuando el tipo de modelo está ajustado a ARIMA. Sin embargo, puede agregar una tendencia exponencial a largo plazo constante a un modelo de suavizado exponencial simple (con o sin ajuste estacional) utilizando la opción de ajuste de inflación en el procedimiento de Pronóstico. La tasa apropiada de inflación (crecimiento porcentual) por período puede estimarse como el coeficiente de pendiente en un modelo de tendencia lineal ajustado a los datos en conjunción con una transformación de logaritmo natural o puede basarse en otra información independiente sobre las perspectivas de crecimiento a largo plazo . (Regreso al inicio de la página.) Browns Linear (es decir, doble) Suavizado exponencial Los modelos SMA y SES suponen que no hay ninguna tendencia de ningún tipo en los datos (que normalmente está bien o al menos no es demasiado malo para 1- Avance anticipado cuando los datos son relativamente ruidosos), y se pueden modificar para incorporar una tendencia lineal constante como se muestra arriba. ¿Qué pasa con las tendencias a corto plazo? Si una serie muestra una tasa de crecimiento variable o un patrón cíclico que se destaca claramente contra el ruido, y si hay una necesidad de pronosticar más de un período, la estimación de una tendencia local también podría ser un problema. El modelo de suavizado exponencial simple puede ser generalizado para obtener un modelo lineal de suavizado exponencial (LES) que calcula las estimaciones locales de nivel y tendencia. El modelo de tendencia más simple que varía en función del tiempo es el modelo lineal de suavizado exponencial de Browns, que utiliza dos series suavizadas diferentes centradas en diferentes momentos del tiempo. La fórmula de predicción se basa en una extrapolación de una línea a través de los dos centros. (Una versión más sofisticada de este modelo, Holt8217s, se discute a continuación). La forma algebraica del modelo de suavizado exponencial lineal de Brown8217s, como la del modelo de suavizado exponencial simple, puede expresarse en varias formas diferentes pero equivalentes. La forma estándar de este modelo se expresa usualmente de la siguiente manera: Sea S la serie de suavizado simple obtenida aplicando el suavizado exponencial simple a la serie Y. Es decir, el valor de S en el periodo t está dado por: (Recuérdese que, Exponencial, esta sería la previsión para Y en el período t1). Entonces, Squot denote la serie doblemente suavizada obtenida aplicando el suavizado exponencial simple (usando el mismo 945) a la serie S: Finalmente, la previsión para Y tk. Para cualquier kgt1, viene dado por: Esto produce e 1 0 (es decir, trucar un poco y dejar que el primer pronóstico sea igual a la primera observación real), y e 2 Y 2 8211 Y 1. Después de lo cual las previsiones se generan usando la ecuación anterior. Esto produce los mismos valores ajustados que la fórmula basada en S y S si estos últimos se iniciaron usando S 1 S 1 Y 1. Esta versión del modelo se utiliza en la página siguiente que ilustra una combinación de suavizado exponencial con ajuste estacional. Holt8217s Linear Exponential Smoothing Brown8217s El modelo LES calcula las estimaciones locales de nivel y tendencia al suavizar los datos recientes, pero el hecho de que lo haga con un solo parámetro de suavizado impone una restricción en los patrones de datos que puede encajar: el nivel y la tendencia No se les permite variar a tasas independientes. El modelo LES de Holt8217s aborda este problema incluyendo dos constantes de suavizado, una para el nivel y otra para la tendencia. En cualquier momento t, como en el modelo Brown8217s, existe una estimación L t del nivel local y una estimación T t de la tendencia local. Aquí se calculan recursivamente a partir del valor de Y observado en el instante t y de las estimaciones previas del nivel y de la tendencia por dos ecuaciones que les aplican el suavizado exponencial separadamente. Si el nivel estimado y la tendencia en el tiempo t-1 son L t82091 y T t-1. Respectivamente, entonces la previsión de Y tshy que habría sido hecha en el tiempo t-1 es igual a L t-1 T t-1. Cuando se observa el valor real, la estimación actualizada del nivel se calcula recursivamente interpolando entre Y tshy y su pronóstico, L t-1 T t-1, utilizando pesos de 945 y 1-945. El cambio en el nivel estimado, Es decir L t 8209 L t82091. Puede interpretarse como una medida ruidosa de la tendencia en el tiempo t. La estimación actualizada de la tendencia se calcula recursivamente mediante la interpolación entre L t 8209 L t82091 y la estimación anterior de la tendencia, T t-1. Utilizando los pesos de 946 y 1-946: La interpretación de la constante de suavizado de tendencia 946 es análoga a la de la constante de suavizado de nivel 945. Los modelos con valores pequeños de 946 asumen que la tendencia cambia muy lentamente con el tiempo, mientras que los modelos con 946 más grandes suponen que está cambiando más rápidamente. Un modelo con una gran 946 cree que el futuro lejano es muy incierto, porque los errores en la estimación de la tendencia son muy importantes cuando se pronostica más de un período por delante. Las constantes de suavizado 945 y 946 se pueden estimar de la manera habitual minimizando el error cuadrático medio de los pronósticos de 1 paso adelante. Cuando esto se hace en Statgraphics, las estimaciones resultan ser 945 0.3048 y 946 0.008. El valor muy pequeño de 946 significa que el modelo supone muy poco cambio en la tendencia de un período al siguiente, por lo que básicamente este modelo está tratando de estimar una tendencia a largo plazo. Por analogía con la noción de la edad media de los datos que se utilizan para estimar el nivel local de la serie, la edad media de los datos que se utilizan para estimar la tendencia local es proporcional a 1/946, aunque no exactamente igual a eso. En este caso, resulta ser 1 / 0.006 125. Esto no es un número muy preciso en la medida en que la precisión de la estimación de 946 es realmente de 3 decimales, pero es del mismo orden general de magnitud que el tamaño de la muestra de 100 , Por lo que este modelo está promediando bastante historia en la estimación de la tendencia. La gráfica de pronóstico siguiente muestra que el modelo LES calcula una tendencia local ligeramente mayor al final de la serie que la tendencia constante estimada en el modelo SEStrend. Además, el valor estimado de 945 es casi idéntico al obtenido ajustando el modelo SES con o sin tendencia, por lo que este es casi el mismo modelo. Ahora, ¿se ven como pronósticos razonables para un modelo que se supone que está estimando una tendencia local? Si observa esta gráfica, parece que la tendencia local se ha vuelto hacia abajo al final de la serie. Lo que ha ocurrido Los parámetros de este modelo Se han estimado minimizando el error al cuadrado de las previsiones de un paso adelante, y no las previsiones a largo plazo, en cuyo caso la tendencia no hace mucha diferencia. Si todo lo que usted está mirando son errores de un paso adelante, no está viendo la imagen más grande de las tendencias sobre (digamos) 10 o 20 períodos. Con el fin de obtener este modelo más en sintonía con la extrapolación de nuestro ojo de los datos, podemos ajustar manualmente la tendencia de suavizado constante de modo que utiliza una base más corta para la estimación de tendencia. Por ejemplo, si elegimos establecer 946 0.1, la edad promedio de los datos utilizados para estimar la tendencia local es de 10 períodos, lo que significa que estamos promediando la tendencia en los últimos 20 períodos aproximadamente. Here8217s lo que el pronóstico gráfico parece si fijamos 946 0.1 mientras que mantener 945 0.3. Esto parece intuitivamente razonable para esta serie, aunque probablemente sea peligroso extrapolar esta tendencia en más de 10 periodos en el futuro. ¿Qué pasa con las estadísticas de errores? Aquí hay una comparación de modelos para los dos modelos mostrados arriba, así como tres modelos SES. El valor óptimo de 945 para el modelo SES es de aproximadamente 0,3, pero se obtienen resultados similares (con un poco más o menos de capacidad de respuesta, respectivamente) con 0,5 y 0,2. (A) Holts lineal exp. Alisamiento con alfa 0.3048 y beta 0.008 (B) Holts linear exp. Alisamiento con alfa 0.3 y beta 0.1 (C) Suavizado exponencial simple con alfa 0.5 (D) Alisamiento exponencial simple con alfa 0.3 (E) Suavizado exponencial simple con alfa 0.2 Sus estadísticas son casi idénticas, por lo que realmente no podemos hacer la elección sobre la base De errores de pronóstico de un paso adelante en la muestra de datos. Tenemos que recurrir a otras consideraciones. Si creemos firmemente que tiene sentido basar la estimación de tendencia actual en lo que ha ocurrido durante los últimos 20 períodos, podemos hacer un caso para el modelo LES con 945 0.3 y 946 0.1. Si queremos ser agnósticos acerca de si hay una tendencia local, entonces uno de los modelos SES podría ser más fácil de explicar y también daría más pronósticos intermedios para los próximos 5 o 10 períodos. (Volver al principio de la página.) Qué tipo de tendencia-extrapolación es la mejor: horizontal o lineal La evidencia empírica sugiere que, si los datos ya han sido ajustados (si es necesario) para la inflación, puede ser imprudente extrapolar lineal a corto plazo Tendencias en el futuro. Las tendencias evidentes hoy en día pueden desacelerarse en el futuro debido a causas variadas como la obsolescencia del producto, el aumento de la competencia y las caídas o repuntes cíclicos en una industria. Por esta razón, el suavizado exponencial simple a menudo realiza mejor fuera de la muestra de lo que de otra manera podría esperarse, a pesar de su extrapolación horizontal de tendencia horizontal. Las modificaciones de la tendencia amortiguada del modelo de suavizado exponencial lineal también se usan a menudo en la práctica para introducir una nota de conservadurismo en sus proyecciones de tendencia. El modelo LES con tendencia amortiguada se puede implementar como un caso especial de un modelo ARIMA, en particular, un modelo ARIMA (1,1,2). Es posible calcular intervalos de confianza en torno a los pronósticos a largo plazo producidos por modelos de suavizado exponencial, al considerarlos como casos especiales de modelos ARIMA. El ancho de los intervalos de confianza depende de (i) el error RMS del modelo, (ii) el tipo de suavizado (simple o lineal) (iii) el valor (S) de la (s) constante (s) de suavizado y (iv) el número de periodos por delante que está pronosticando. En general, los intervalos se extienden más rápidamente a medida que el 945 se hace más grande en el modelo SES y se extienden mucho más rápido cuando se usa lineal en lugar de simple suavizado. Este tema se discute más adelante en la sección de modelos de ARIMA de las notas. (Volver al inicio de la página.)

No comments:

Post a Comment