Promedio De Los Términos Promedio Arima


Esta pregunta ya tiene una respuesta aquí: Para un modelo ARIMA (0,0,1), entiendo que R sigue la ecuación: xt mu e (t) thetae (t-1) (Por favor corrija si estoy equivocado) I Suponga que e (t-1) es el mismo que el residuo de la última observación. Por ejemplo, aquí están las primeras cuatro observaciones en una muestra de datos: 526 658 624 611 Estos son los parámetros Arima (0,0,1) modelo dio: intercepto 246,1848 ma1 0,9893 Y el primer valor que R ajustando usando el modelo es: 327.0773 ¿Cómo consigo el segundo valor que utilicé: 246.1848 (0.9893 (526-327.0773)) 442.979 Pero el 2do valor cabido dado por R es. 434.7928 Supongo que la diferencia se debe al término e (t). Pero no sé cómo calcular el término e (t). Pidió Jul 28 14 a las 16:12 marcado como duplicado por Glenb 9830. Nick Stauner. Whuber 9830 Jul 29 14 at 1:24 Esta pregunta se ha hecho antes y ya tiene una respuesta. Si esas respuestas no responden completamente a su pregunta, haga una nueva pregunta. Usted podría obtener los valores ajustados como pronósticos de un solo paso utilizando el algoritmo de innovaciones. Véase por ejemplo la proposición 5.5.2 en Brockwell y Davis downloable de Internet encontré estas diapositivas. Es mucho más fácil obtener los valores ajustados como la diferencia entre los valores observados y los residuos. En este caso, su pregunta se reduce a la obtención de los residuos. Por ejemplo, podemos obtener el residuo en el punto de tiempo 140 como el valor observado en t140 menos la media estimada menos Hat veces el residuo anterior, t139): El filtro de función se puede utilizar para hacer estos cálculos: Usted puede ver que el resultado está muy cerca de los residuos devueltos por los residuos. La diferencia en los primeros residuos es más probable debido a alguna inicialización que puede haber omitido. Los valores ajustados son sólo los valores observados menos los residuos: En la práctica se deben utilizar las funciones residuales y ajustadas pero para fines pedagógicos se puede probar la ecuación recursiva utilizada anteriormente. Puede comenzar haciendo algunos ejemplos a mano como se muestra arriba. Te recomiendo que leas también la documentación del filtro de funciones y comparas algunos de tus cálculos con él. Una vez que entienda las operaciones involucradas en el cálculo de los valores residuales y ajustados podrá hacer un uso bien informado de las funciones más prácticas residuales y montadas. Usted puede encontrar alguna otra información relacionada con su pregunta en este post. Un RIMA significa Autoregressive Integrated Moving Average. Univariante (vector único) ARIMA es una técnica de previsión que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su aplicación principal es en el área de pronósticos a corto plazo que requieren al menos 40 puntos de datos históricos. Funciona mejor cuando los datos muestran un patrón estable o consistente en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de los autores originales), ARIMA suele ser superior a las técnicas de suavización exponencial cuando los datos son razonablemente largos y la correlación entre las observaciones pasadas es estable. Si los datos son cortos o muy volátiles, entonces algún método de suavizado puede funcionar mejor. Si usted no tiene por lo menos 38 puntos de datos, debe considerar algún otro método que ARIMA. El primer paso para aplicar la metodología ARIMA es verificar la estacionariedad. La estacionariedad implica que la serie permanece a un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, sus datos NO son estacionarios. Los datos también deben mostrar una variación constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y que crece a un ritmo más rápido. En tal caso, los altibajos en la estacionalidad se harán más dramáticos con el tiempo. Si no se cumplen estas condiciones de estacionariedad, no se pueden calcular muchos de los cálculos asociados con el proceso. Si un gráfico gráfico de los datos indica nonstationarity, entonces usted debe diferenciar la serie. La diferenciación es una excelente forma de transformar una serie no estacionaria en una serie estacionaria. Esto se hace restando la observación en el período actual a la anterior. Si esta transformación se realiza sólo una vez en una serie, se dice que los datos se han diferenciado primero. Este proceso esencialmente elimina la tendencia si su serie está creciendo a una tasa bastante constante. Si está creciendo a un ritmo creciente, puede aplicar el mismo procedimiento y diferenciar los datos de nuevo. Sus datos entonces serían segundos diferenciados. Las autocorrelaciones son valores numéricos que indican cómo una serie de datos se relaciona a sí misma con el tiempo. Más precisamente, mide cuán fuertemente están correlacionados los valores de datos en un número específico de períodos separados entre sí a lo largo del tiempo. El número de períodos separados se llama generalmente el retraso. Por ejemplo, una autocorrelación en el retardo 1 mide cómo los valores 1 período aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso 2 mide cómo los datos dos períodos aparte están correlacionados a lo largo de la serie. Las autocorrelaciones pueden variar de 1 a -1. Un valor próximo a 1 indica una alta correlación positiva, mientras que un valor cercano a -1 implica una correlación negativa alta. Estas medidas se evalúan con mayor frecuencia a través de tramas gráficas llamadas correlagramas. Un correlagrama traza los valores de autocorrelación para una serie dada con diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. La metodología ARIMA intenta describir los movimientos en una serie temporal estacionaria como una función de lo que se llaman parámetros de media móvil y autorregresiva. Estos parámetros se denominan parámetros AR (autoregessivos) y MA (medias móviles). Un modelo de AR con un solo parámetro se puede escribir como. X (t) A (1) X (t-1) E (t) donde X (t) serie temporal bajo investigación A (1) el parámetro autorregresivo de orden 1 X (t-1) (T) el término de error del modelo Esto simplemente significa que cualquier valor dado X (t) puede explicarse por alguna función de su valor anterior, X (t-1), más algún error aleatorio inexplicable, E (t). Si el valor estimado de A (1) fue de 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionada con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), más algún error aleatorio E (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Modelos de media móvil: Un segundo tipo de modelo de Box-Jenkins se denomina modelo de media móvil. Aunque estos modelos parecen muy similares al modelo de AR, el concepto detrás de ellos es muy diferente. Los parámetros de la media móvil relacionan lo que sucede en el período t sólo con los errores aleatorios que ocurrieron en períodos de tiempo pasados, es decir, E (t-1), E (t-2), etc., en lugar de X (t-1), X T-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA puede escribirse como sigue. El término B (1) se denomina un MA de orden 1. El signo negativo delante del parámetro se utiliza para la convención solamente y se imprime generalmente La mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente al error aleatorio en el período anterior, E (t-1), y al término de error actual, E (t). Como en el caso de modelos autorregresivos, los modelos de media móvil pueden extenderse a estructuras de orden superior que abarcan diferentes combinaciones y longitudes móviles. La metodología ARIMA también permite la construcción de modelos que incorporen parámetros tanto de autorregresión como de media móvil. Estos modelos se refieren a menudo como modelos mixtos. Aunque esto hace que sea una herramienta de pronóstico más complicada, la estructura puede simular mejor la serie y producir un pronóstico más preciso. Los modelos puros implican que la estructura consiste solamente en los parámetros AR o MA - no ambos. Los modelos desarrollados por este enfoque usualmente se llaman modelos ARIMA porque usan una combinación de autoregresión (AR), integración (I), que se refiere al proceso inverso de diferenciación para producir las operaciones de predicción y de media móvil (MA). Un modelo de ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (p), el número de operadores de diferenciación (d) y el orden más alto del término medio móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo autorregresivo de segundo orden con un componente de media móvil de primer orden cuya serie se ha diferenciado una vez para inducir la estacionariedad. Elegir la especificación correcta: El principal problema en el clásico Box-Jenkins es tratar de decidir qué especificación ARIMA utilizar-i. e. Cuántos AR y / o MA parámetros para incluir. Esto es lo que gran parte de Box-Jenkings 1976 se dedicó al proceso de identificación. Dependía de la eva - luación gráfica y numérica de las funciones de autocorrelación de la muestra y de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, sus datos representan sólo una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, errores de medición, etc.) pueden distorsionar el proceso teórico de identificación. Es por eso que el modelado ARIMA tradicional es un arte más que una ciencia.3.1 Modelos ARIMA no estacionales Los modelos ARIMA, también llamados modelos Box-Jenkins, son modelos que posiblemente incluyen términos autorregresivos, términos medios móviles y operaciones de diferenciación. Se utilizan varias abreviaturas: Cuando un modelo sólo implica términos autorregresivos, puede denominarse un modelo AR. Cuando un modelo sólo involucra términos de media móvil, puede ser referido como un modelo de MA. Cuando no hay diferencias, se puede usar la abreviatura ARMA. Nota . Esta semana sólo estaban considerando modelos no estacionales. Bien ampliar nuestro kit de herramientas para incluir modelos estacionales la próxima semana. Especificación de los elementos del modelo En la mayoría de los programas de software, los elementos del modelo se especifican en el orden (orden AR, diferencia, orden MA). Como ejemplos, un modelo con (sólo) dos términos AR sería especificado como un ARIMA de orden (2,0,0). Un modelo MA (2) sería especificado como un ARIMA de orden (0,0,2). Un modelo con un término AR, una primera diferencia y un término MA tendría orden (1,1,1). Para el último modelo, ARIMA (1,1,1), se está aplicando un modelo con un término AR y un término MA a la variable z t x t - x t-1. Una primera diferencia podría ser utilizada para explicar una tendencia lineal en los datos. La orden de diferenciación se refiere a las primeras diferencias sucesivas. Por ejemplo, para un orden de diferencia 2 la variable analizada es z t (x t - x t-1) - (x t-1 - x t-2), la primera diferencia de las primeras diferencias. Este tipo de diferencia podría explicar una tendencia cuadrática en los datos. Identificación de un posible modelo Se deben considerar tres elementos para determinar una primera suposición en un modelo ARIMA: un gráfico de la serie temporal de los datos, el ACF y el PACF. Gráfica de series temporales de las series observadas. En la lección 1.1, discutimos qué buscar: tendencia posible, estacionalidad, valores atípicos, varianza constante o varianza no constante. Usted no será capaz de detectar cualquier modelo en particular, mirando a este argumento, pero usted será capaz de ver la necesidad de varias acciones posibles. Si existe una evidente tendencia lineal ascendente o descendente, puede ser necesaria una primera diferencia. Una tendencia cuadrática podría necesitar una diferencia de orden 2 (como se ha descrito anteriormente). Rara vez queremos ir mucho más allá de dos. En esos casos, es posible que desee pensar en cosas como suavizar, que cubriremos más adelante en el curso. La diferencia excesiva puede provocar que introdujamos niveles innecesarios de dependencia (diferencia de ruido blanco para obtener una diferencia MA (1) de nuevo para obtener un MA (2), etc.) Para los datos con una tendencia ascendente curvada acompañada de un aumento de la varianza, Considere transformar la serie con un logaritmo o una raíz cuadrada. Nota . Variación no constante en una serie sin tendencia puede tener que ser abordado con algo como un modelo de ARCH que incluye un modelo para cambiar la variación en el tiempo. El pozo cubre los modelos ARCH más adelante en el curso. El ACF y el PACF deben ser considerados juntos. A veces puede ser complicado ir, pero algunos patrones combinados se destacan. (Éstos se enumeran en la tabla 3.1 del libro en la página 108). Los modelos AR tienen PACFs teóricos con valores distintos de cero en los términos AR en el modelo y valores cero en otras partes. El ACF se reducirá a cero de alguna manera. (Ejemplo) Un modelo AR (1) tiene un ACF con un patrón Un AR (2) tiene un ACF sinusoidal que converge a 0. (Ejemplo) Los modelos MA tienen ACFs teóricos con valores no nulos en los términos MA en el modelo y Valores cero en otros lugares. (Ejemplo) Los modelos ARMA (incluyendo los términos AR y MA) tienen ACFs y PACFs que se posan a 0. Estos son los más complicados porque el orden no será particularmente obvio. Básicamente, sólo tienes que adivinar que uno o dos términos de cada tipo puede ser necesario y luego ver qué pasa cuando se estima el modelo. (Ejemplo) Si el ACF y el PACF no se detienen, sino que tienen valores que se mantienen cerca de 1 sobre muchos retrasos, la serie no es estacionaria y se necesitarán diferencias. Pruebe una primera diferencia y luego mire el ACF y PACF de los datos diferenciados. Si todas las autocorrelaciones no son significativas, entonces la serie es aleatoria (ruido blanco, el orden es importante, pero los datos son independientes e idénticamente distribuidos.) Se hace en ese punto. Si usted ha tomado las primeras diferencias y todas las autocorrelaciones no son significativas, entonces la serie se llama una caminata aleatoria y ya está. (Un modelo posible para una caminata aleatoria es x t x t-1 w t Los datos son dependientes y no están distribuidos de forma idéntica, de hecho tanto la media como la varianza están aumentando a través del tiempo). También puede considerar examinar parcelas de x t frente a varios rezagos de x t. Estimación y diagnóstico de un posible modelo Después de haber hecho una conjetura (o dos) en un posible modelo, utilice software como R, Minitab o SAS para estimar los coeficientes. La mayoría del software utilizará métodos de estimación de máxima verosimilitud para hacer las estimaciones. Una vez que el modelo ha sido estimado, haga lo siguiente. Observe la importancia de los coeficientes. En R, p-valores no son dados. Para cada coeficiente, calcule z coeficiente estimado. / Std. Error de coeff. Si z gt 1,96, el coeficiente estimado es significativamente diferente de 0. Mire el ACF de los residuos. Para un buen modelo, todas las autocorrelaciones para la serie residual deben ser no significativas. Si este no es el caso, es necesario probar un modelo diferente. Examine las pruebas de Box-Pierce (Ljung) para determinar la posible autocorrelación residual en varios retrasos (ver la lección 3.2 para una descripción de esta prueba). Si la varianza no constante es una preocupación, observe un gráfico de los residuos frente a ajustes y / o un gráfico de la serie temporal de los residuos. Si algo parece mal, youll tiene que revisar su conjetura en lo que el modelo podría ser. Esto podría implicar la adición de parámetros o la reinterpretación de la ACF original y PACF para posiblemente moverse en una dirección diferente. ¿Qué pasa si más de un modelo parece bien? A veces, más de un modelo puede parecer que funciona para el mismo conjunto de datos. Cuando ese es el caso, algunas cosas que usted puede hacer para decidir entre los modelos son: Posiblemente elegir el modelo con el menor número de parámetros. Examinar errores estándar de los valores de pronóstico. Elija el modelo con los errores estándar generalmente más bajos para las predicciones del futuro. Comparar los modelos con respecto a las estadísticas como el MSE (la estimación de la varianza de la w t), AIC, AICc y SIC (también llamado BIC). Los valores más bajos de estas estadísticas son deseables. AIC, AICc y SIC (o BIC) están definidos y discutidos en las páginas 52-53 de nuestro libro. Las estadísticas combinan la estimación de la varianza con los valores del tamaño de la muestra y el número de parámetros del modelo. Una razón por la que dos modelos pueden parecer dar los mismos resultados es que, con los valores de determinados coeficientes, dos modelos diferentes a veces pueden ser casi equivalentes cuando cada uno se convierte en un modelo de orden infinito MA. Cada modelo ARIMA puede ser convertido en un orden infinito MA esto es útil para algunos trabajos teóricos, incluyendo la determinación de errores estándar para errores de pronóstico. Bueno, vea más sobre esto en la Lección 3.2. Ejemplo 1 . Los datos del Lago Erie de la asignación de la Semana 1. La serie es n 40 mediciones anuales consecutivas del nivel del lago Erie en octubre. Identificar el modelo. Un diagrama de la serie de tiempo de los datos es el siguiente: Theres una posibilidad de una cierta tendencia general, pero podría mirar de esa manera sólo porque parecía haber una gran inmersión alrededor de la 15 ª vez más o menos. Bueno seguir adelante sin preocuparse por la tendencia. El ACF y el PACF de la serie son los siguientes. (Empiezan con el retardo 1). El PACF muestra un único pico en el primer retraso y el ACF muestra un patrón de ahusamiento. Se indica un modelo AR (1). Estimación del modelo Se utilizó un guión R escrito por uno de los autores de nuestro libro (Stoffer) para estimar el modelo AR (1). Heres parte de la salida: sigma2 estimado como 1.447: log probabilidad -64.47, AIC 1 1.469364 AICc 1 1.536030 BIC 1 0.5538077 En caso de que los coeficientes se enumeran, observe el título xmean. Esto es dar la media estimada de la serie basada en este modelo, no la intercepción. El modelo utilizado en el software es de la forma ((xt-mu) phi1 (x-mu) wt). El coeficiente AR es estadísticamente significativo (z 0.6909 / 0.1094 6.315). No es necesario probar el coeficiente medio. Sabemos que no es 0. La rutina de los autores también da diagnósticos residuales en la forma de varios gráficos. El gráfico de la serie de tiempo de los residuos estandarizados indica que no hay tendencia en los residuos, no hay valores atípicos y, en general, no hay variación cambiante a través del tiempo. El ACF de los residuos no muestra autocorrelaciones significativas un buen resultado. El gráfico Q-Q es un gráfico de probabilidad normal. No parece demasiado malo, por lo que la suposición de residuos normalmente distribuidos parece bien. El gráfico del fondo da valores de p para las estadísticas de Ljung-Box-Pierce para cada retraso de hasta 20. Estas estadísticas consideran la autocorrelación residual acumulada desde el retardo 1 hasta el retraso en el eje horizontal. La línea azul discontinua está en .05. Todos los p-valores están por encima de él. Eso es un buen resultado. Queremos valores no significativos para esta estadística cuando se examinan los residuos. Lea la lección 3.2 de esta semana para más información sobre la estadística LjungBox-Pierce. Con todo, el ajuste se ve bien. No hay mucha necesidad de continuar, pero sólo para mostrar cómo se ven las cosas cuando se usan modelos incorrectos, presentaremos otro modelo. Ejemplo 1 Continuación: Salida para un modelo erróneo Suponga que hemos malinterpretado el ACF y el PACF de los datos y hemos probado un modelo MA (1) en lugar del modelo AR (1). Heres la salida: sigma2 estimado como 1.439: probabilidad de registro -64.36, AIC 1 1.514079 AICc 1 1.592650 BIC 1 0.640745 Tenga en cuenta que el coeficiente MA (1) no es significativo (z -0.0909 / .1969 es menor que 1,96 en valor absoluto). El término MA (1) podría ser eliminado de modo que nos lleva de nuevo a la AR (1). Además, la estimación de la varianza es apenas mejor que la estimación para el modelo AR (1) y las estadísticas AIC y BIC son más altas para ARMA (1,1) que para AR (1). Un ejemplo problemático - Redundancia de parámetros Suponga que el modelo para sus datos es ruido blanco. Si esto es cierto para cada t. Entonces es verdad para t - 1 también, en otras palabras: Vamos a multiplicar ambos lados de la segunda ecuación por 0.5: A continuación, moveremos ambos términos a un lado: Dado que los datos son ruido blanco, x t w t. Por lo que podemos añadir x t al lado izquierdo y w t al lado derecho: (xt -0,5x wt 0.5w) Esto es un ARMA (1, 1) El problema es que sabemos que es ruido blanco debido a las ecuaciones originales. Si miramos el ACF qué veríamos Usted vería el ACF que corresponde al ruido blanco, un punto en cero y entonces nada más. Esto también significa que si tomamos el proceso de ruido blanco y tratamos de encajar en un ARMA (1, 1), R lo hará y vendrá con coeficientes que parezca algo como lo que tenemos arriba. Esta es una de las razones por las que tenemos que mirar la ACF y las parcelas PACF y otros diagnósticos. Preferimos un modelo con el menor número de parámetros. Este ejemplo también dice que para ciertos valores de parámetros, los modelos ARMA pueden aparecer muy similares entre sí. Código R para el Ejemplo 1 Aquí se explica cómo realizamos el trabajo para el ejemplo de esta lección. Primero cargamos la biblioteca de astsa discutida en la lección 1. Es un conjunto de guiones escritos por Stoffer, uno de los autores de libros de texto. Si instaló el paquete astsa durante la semana 1, sólo necesita el comando library. Utilice la biblioteca de comandos (astsa). Esto hace que las rutinas descargadas sean accesibles. La sesión para crear el Ejemplo 1 procede de la siguiente manera: xerie scan (eriedata. dat) lee los datos xerie ts (xerie) asegura que xerie es una serie de tiempo plot (xerie, type b) traza xerie acf2 (xerie) (Xerie, 0, 0, 0) este es el modelo AR (1) estimado con el sarima de la rutina de los autores (xerie, 0, 0, 1) este es el modelo incorrecto MA (1) sarima (Xerie, 1, 0, 1) este es el modelo ARMA (1,1) sobre-parametrizado En la Lección 3.3, discutiremos bien el uso de modelos ARIMA para la predicción. Heres cómo se pronosticaría para los próximos 4 veces más allá del final de la serie utilizando el código fuente de los autores y el modelo AR (1) para los datos de Lake Erie. Cuatro pronósticos de un modelo AR (1) para los datos erie obtendrá pronósticos para las próximas cuatro veces, los errores estándar para estas previsiones, y un gráfico de la serie de tiempo Junto con las previsiones. Más detalles sobre la predicción se darán en la Lección 3.3. Alguna información útil sobre los scripts de los autores está en stat. pitt. edu/stoffer/tsa3. Navegación

Comments

Popular Posts