Stata Genera La Variable Media Móvil


Esta estructura de datos es bastante inapropiada para el propósito. Asumiendo un id de identificador que usted necesita para remodelar. p. ej. Entonces una media móvil es fácil. Utilice tssmooth o simplemente genere. p. ej. Más sobre por qué su estructura de datos es bastante inapropiada: No sólo el cálculo de un promedio móvil necesita un bucle (no necesariamente involucrando a egen), sino que estaría creando varias nuevas variables adicionales. Usarlos en cualquier análisis subsecuente sería algo entre incómodo e imposible. EDIT III dar un bucle de muestra, mientras que no se mueve de mi postura que es mala técnica. No veo una razón detrás de su convención de nombrar por lo que P1947 es un medio para 1943-1945 Supongo que es sólo un error tipográfico. Supongamos que tenemos datos para 1913-2012. Por medios de 3 años, perdemos un año en cada extremo. Eso podría escribirse más concisamente, a expensas de una ráfaga de macros dentro de macros. Usando pesos desiguales es fácil, como arriba. La única razón para usar egen es que no se da por vencido si hay fallos, lo que hará lo anterior. Como una cuestión de integridad, tenga en cuenta que es fácil de manejar faltas sin recurrir a egen. Y el denominador Si faltan todos los valores, esto se reduce a 0/0, o falta. De lo contrario, si falta algún valor, agregamos 0 al numerador y 0 al denominador, lo cual equivale a ignorarlo. Naturalmente el código es tolerable como arriba para los promedios de 3 años, pero para ese caso o para el promediado durante más años, reemplazaríamos las líneas arriba por un lazo, que es lo que hace egen. Bienvenido al Instituto de Investigación Digital y Educación Módulo de aprendizaje Stata Creación y recodificación de variables Este módulo muestra cómo crear y recodificar variables. En Stata puede crear nuevas variables con generate y puede modificar los valores de una variable existente con replace y con recode. Cálculo de nuevas variables mediante generar y reemplazar Permite utilizar los datos automáticos para nuestros ejemplos. En esta sección veremos cómo calcular variables con generate y replace. La longitud variable contiene la longitud del coche en pulgadas. A continuación vemos estadísticas resumidas de longitud. Permite usar el comando generate para crear una nueva variable que tenga la longitud en pies en lugar de pulgadas, llamada lenft. Debemos enfatizar que generar es para crear una nueva variable. Para una variable existente, necesita usar el comando replace (no generar). Como se muestra a continuación, usamos replace para repetir la asignación a lenft. La sintaxis de generar y reemplazar es idéntica, excepto: - generar trabajos cuando la variable aún no existe y dará un error si la variable ya existe. - reemplazar funciona cuando la variable ya existe, y dará un error si la variable aún no existe. Supongamos que queremos hacer una variable llamada length2 que tiene longitud al cuadrado. O podríamos querer hacer loglen que es el log natural de longitud. Permite obtener la media y desviación estándar de la longitud y podemos hacer Z-puntuaciones de longitud. La media es 187.93 y la desviación estándar es 22.27, por lo que zlength se puede calcular como se muestra a continuación. Con generar y reemplazar puede utilizar - para la suma y resta que puede utilizar / para la multiplicación y división que puede utilizar para exponentes (por ejemplo, longitud2) puede utilizar () para controlar el orden de las operaciones. Recodificación de nuevas variables utilizando generar y reemplazar Supongamos que queríamos romper el mpg en tres categorías. Echemos un vistazo a una tabla de mpg para ver dónde podemos dibujar las líneas para estas categorías. Permite convertir mpg en tres categorías para ayudar a hacer esto más legible. Aquí convertimos mpg en tres categorías usando generar y reemplazar. Permite tabular para comprobar que funcionó correctamente. De hecho, se puede ver que un valor de 1 para mpg3 va de 12-18, un valor de 2 va de 19-23, y un valor de 3 va de 24-41. Ahora, podríamos usar mpg3 para mostrar una tabla cruzada de mpg3 por extranjeros para contrastar el kilometraje de los coches nacionales y extranjeros. La tabla de referencias anteriores muestra que 21 de los automóviles nacionales entran en la categoría de alto kilometraje, mientras que 55 de los coches extranjeros encajan en esta categoría. Recodificación de variables usando recode Hay una manera más fácil de recodificar mpg a tres categorías usando generar y recodificar. Primero, hacemos una copia de mpg. Llamándolo mpg3a. Entonces, usamos recode para convertir mpg3a en tres categorías: min-18 en 1, 19-23 en 2, y 24-max en 3. Deja doble verificación para ver que esto funcionó correctamente. Vemos que funcionó perfectamente. Recodes con si creamos una variable llamada mpgfd que evalúa el kilometraje de los coches con respecto a su origen. Sea esto una variable 0/1 llamada mpgfd que es: 0 si está por debajo del mpg mediano para su grupo (extranjero / doméstico) 1 si está en / por encima del mpg mediano para su grupo (extranjero / doméstico). Vemos que la mediana es 19 para los automóviles domésticos (extranjeros) y 24,5 para los extranjeros (extranjeros). Los comandos de generación y recodificación que figuran a continuación recodifican mpg en mpgfd basado en la mediana de automóviles nacionales para los automóviles nacionales y en función de la mediana de vehículos extranjeros para los automóviles extranjeros. Podemos comprobar usando esto a continuación, y el valor recodificado mpgfd parece correcto. Resumen Crea una nueva variable lenft cuya longitud se divide por 12. Cambia los valores de una variable existente denominada lenft. Recode mpg en mpg3. Tener tres categorías usando generar y reemplazar si. Recodificar mpg en mpg3a. Con tres categorías, 1 2 3, utilizando generar y recodificar. Recode mpg en mpgfd. Teniendo dos categorías, pero utilizando diferentes puntos de corte para los coches nacionales y extranjeros. El contenido de este sitio web no debe interpretarse como un endoso de cualquier sitio web, libro o producto de software en particular por la Universidad de California. Estadística: Análisis de Datos y Software Estadístico Nicholas J. Cox, Universidad de Durham, Reino Unido Christopher Baum, Boston College egen, ma () y sus limitaciones El comando más obvio de Statarsquos para calcular promedios móviles es la función ma () de egen. Dada una expresión, crea un promedio móvil de esa expresión. De forma predeterminada, se toma como 3. debe ser impar. Sin embargo, como indica la entrada manual, egen, ma () no se puede combinar con varlist:. Y, por esa sola razón, no es aplicable a los datos de los grupos especiales. En cualquier caso, se encuentra fuera del conjunto de comandos específicamente escritos para las series de tiempo ver series de tiempo para más detalles. Métodos alternativos Para calcular las medias móviles de los datos del panel, hay al menos dos opciones. Ambos dependen de que el conjunto de datos haya sido tsset de antemano. Esto vale mucho la pena: no sólo puede ahorrarse repetidamente especificando la variable de panel y la variable de tiempo, pero Stata se comporta de manera inteligente dada lagunas en los datos. 1. Escriba su propia definición utilizando generate Usando operadores de series de tiempo como L. y F.. Dar la definición de la media móvil como el argumento a una declaración de generar. Si lo hace, naturalmente, no está limitado a los promedios móviles ponderados (no ponderados) centrados calculados por egen, ma (). Por ejemplo, los promedios móviles de tres periodos ponderados por igual estarían dados por y algunos pesos pueden ser fácilmente especificados: Usted puede, por supuesto, especificar una expresión como log (myvar) en lugar de un nombre de variable como myvar. Una gran ventaja de este enfoque es que Stata hace automáticamente lo correcto para los datos del panel: los valores de avance y retraso se calculan dentro de paneles, tal como la lógica dicta que deberían ser. La desventaja más notable es que la línea de comandos puede ser bastante larga si el promedio móvil implica varios términos. Otro ejemplo es una media móvil unilateral basada sólo en valores anteriores. Esto podría ser útil para generar una expectativa adaptativa de lo que una variable se basará puramente en la información hasta la fecha: ¿qué podría alguien prever para el período actual basado en los últimos cuatro valores, utilizando un esquema de ponderación fijo? Especialmente utilizado con series de tiempos trimestrales.) 2. Utilice egen, filter () de SSC Utilice el filtro de función egen escrito por el usuario () del paquete egenmore en SSC. En Stata 7 (actualizado después del 14 de noviembre de 2001), puede instalar este paquete después de que ayuda egenmore señala los detalles en filter (). Los dos ejemplos anteriores serían renderizados (en esta comparación el enfoque de generar es tal vez más transparente, pero veremos un ejemplo de lo contrario en un momento). Los retrasos son un numlist. Los conductores son retardos negativos: en este caso -1/1 se expande a -1 0 1 o el plomo 1, retrasa 0, retraso 1. Los coeficientes, otro numlist, multiplican los artículos retrasados ​​o principales relevantes: en este caso esos artículos son F1.myvar. Myvar y L1.myvar. El efecto de la opción normalizar es escalar cada coeficiente por la suma de los coeficientes para que coef (1 1 1) normalize sea equivalente a coeficientes de 1/3 1/3 1/3 y coef (1 2 1) normalizar es equivalente A coeficientes de 1/4 1/2 1/4. Debe especificar no sólo los rezagos, sino también los coeficientes. Debido a que egen, ma () proporciona el caso igualmente ponderado, la razón principal para egen, filter () es apoyar el caso desigualmente ponderado, para el cual debe especificar coeficientes. También podría decirse que obligar a los usuarios a especificar coeficientes es un poco más de presión sobre ellos para pensar qué coeficientes quieren. La principal justificación para pesos iguales es, suponemos, la simplicidad, pero los pesos iguales tienen propiedades de dominio de frecuencia pésimas, por mencionar sólo una consideración. El tercer ejemplo anterior podría ser cualquiera de los cuales es casi tan complicado como el enfoque de generar. Hay casos en que egen, filter () da una formulación más simple que generar. Si desea un filtro binomial de nueve términos, que los climatólogos encuentran útil, entonces parece quizás menos horrible que, y más fácil de conseguir que, como con el enfoque de generar, egen, filter () funciona correctamente con los datos del panel. De hecho, como se indicó anteriormente, depende de que el conjunto de datos haya sido tsset de antemano. Una punta gráfica Después de calcular sus promedios móviles, es probable que desee ver un gráfico. El comando escrito por el usuario tsgraph es inteligente acerca de conjuntos de datos tsset. Instálelo en un Stata 7 actualizado por ssc inst tsgraph. ¿Qué pasa con subconjunto con si ninguno de los ejemplos anteriores hacer uso de si las restricciones. De hecho, egen, ma () no permitirá si se especifica. Ocasionalmente la gente quiere usar si al calcular promedios móviles, pero su uso es un poco más complicado de lo que suele ser. ¿Qué esperaría de un promedio móvil calculado con if. Identificemos dos posibilidades: Interpretación débil: No quiero ver ningún resultado para las observaciones excluidas. Interpretación fuerte: Ni siquiera quiero que uses los valores de las observaciones excluidas. He aquí un ejemplo concreto. Suponga como consecuencia de alguna condición if, las observaciones 1-42 están incluidas pero no las observaciones 43 sobre. Pero el promedio móvil de 42 dependerá, entre otras cosas, del valor de observación 43 si el promedio se extiende hacia atrás y hacia adelante y es de longitud por lo menos 3, y dependerá de algunas de las observaciones 44 en adelante en algunas circunstancias. Nuestra conjetura es que la mayoría de la gente iría para la interpretación débil, pero si eso es correcto, egen, filter () no apoya si cualquiera. Siempre se puede ignorar lo que donrsquot quieren o incluso establecer valores no deseados a falta después mediante el uso de reemplazar. Una nota sobre los resultados faltantes en los extremos de la serie Debido a que los promedios móviles son funciones de retrasos y derivaciones, egen, ma () produce falta donde no existen los retrasos y las derivaciones, al principio y al final de la serie. Una opción nomiss obliga al cálculo de promedios móviles más cortos y no centrados para las colas. En contraste, ni generar ni egen, filter () hace, o permite, nada especial para evitar resultados faltantes. Si falta alguno de los valores necesarios para el cálculo, faltará ese resultado. Corresponde a los usuarios decidir si y qué cirugía correctiva se requiere para tales observaciones, presumiblemente después de mirar el conjunto de datos y considerar cualquier ciencia subyacente que pueda ser llevada a cabo.

Comments

Popular Posts