Series temporales - estadistica inf
Enviado por Max Molina • 10 de Junio de 2016 • Documentos de Investigación • 2.166 Palabras (9 Páginas) • 343 Visitas
DISEÑOS DE SERIES TEMPORALES CORTAS. El ESTADÍSTICO C
1.- Introducción 2
2.- Estadístico C 2
3.- Aplicación del estadístico C 4
3.1.- Cuando la línea base no presenta tendencia 5
3.2.- Cuando la línea base presenta tendencia 10
Bibliografía 16
DISEÑOS DE SERIES TEMPORALES CORTAS. El ESTADÍSTICO C
1.- Introducción
Aunque los modelos ARIMA son desde el punto de vista estadístico los más completos para analizar series temporales interrumpidas, tienen el inconveniente de la exigencia de un número relativamente amplio de observaciones para poder ser llevados a cabo. No existe acuerdo unánime entre los distintos autores pero los valores mínimos por fase deben oscilan entre 50 y 100 (Hartmann et al, 1980).
Cuando se trata de fenómenos sociales de alto alcance esta circunstancia no es especialmente problemática. No ocurre lo mismo en diseños conductuales de sujeto único donde no suele ser abundante el número de observaciones. A este respecto se hace necesario el recurso de pruebas alternativas no parámetricas, que aunque menos potentes, resuelven satisfactoriamente este cometido. Se tratan de pruebas tales como los modelos de Edington (Edgington, 1967) o el Estadístico C desarrollado por Tryon (1982) del que nos ocuparemos en estas páginas. Estas pruebas están basadas en el principio de aleatoriedad, que básicamente consiste en determinar si dada una determinada secuencia de observaciones ésta puede ser explicada por el puro azar o no.
2.- Estadístico C
El estadístico C es una prueba adecuada cuando el número de observaciones por fase (los distintos momentos) oscila entre 8 y 20 observaciones. Esto significa que en un diseño AB (A: previo a la intervención, B: posterior) podemos contar con un mínimo total de 16 observaciones. Puede utilizarse igualmente, con la misma lógica, para diseños más complejos, ABA, ABAB… etc.
En esta prueba se trata de determinar si una series de datos temporales presentan o no tendencia. El planteamiento de la prueba es el habitual en estadística del rechazo de la Ho. Se determina la variabilidad observada en los datos y la que habría en ausencia de tendencia o aleatoria. Si ambas coinciden (estadísticamente), no hay tendencia y podemos considerar que el comportamiento de los datos es aleatorio; no ha ocurrido nada. En caso contrario se confirma la tendencia.
Es una prueba sencilla y potente para determinar el supuesto de aleatoriedad, pero no llega más lejos. No es tan fina como la regresión o los modelos ARIMA en donde además se puede conocer la estructura de la tendencia y determinar sus parámetros. Simplemente nos dice si hay o no tendencia, lo cual, como veremos, manejado de la forma adecuada, nos puede informar de la eficacia de la intervención cuando operamos con series temporales interrumpidas.
Una medida de la variabilidad de los datos, que además es sensible a la tendencia es la conocida varianza:
[pic 1]
Obsérvese que una serie que tenga los valores 1, 2, 3, 4, 5, tiene una media de 3 y una varianza de 2.5, mientras que la serie (ya con tendencia ascendente) 1, 2, 3, 4, 5, 6, 8, 9 tiene de media 5 y varianza 6.67. La varianza es mayor cuanto más tendencia tiene la serie, luego podemos tomarla como indicador de dicha tendencia.
Por otro lado, si comparamos cada valor con el consecutivo, según la expresión:
[pic 2]
obtendremos un estadístico que no depende de la existencia o no de estacionariedad en la serie. Las varianzas calculadas de esta forma son iguales para cada serie, ya que las diferencias cuadráticas son con el siguiente valor en la serie y no con la media. Retomando las dos series anteriormente mencionadas, en ambos casos la varianza vale 1.
Con todo ello se configura el estadístico C (Young, 1941), que tiene la siguiente expresión:
[pic 3]
Obsérvese que este estadístico es mayor cuanto mayor sea la tendencia, que viene reflejada en el denominador de la expresión anterior.
Por otro lado, el error estándar del estadístico C es:
[pic 4]
Del cociente entre C y su error estándar se obtiene el estadístico Z:
[pic 5]
que a partir de 25 observaciones tiende a distribuirse según una ley normal de media 0 y varianza 1. No tenemos la suerte de que para valores menores siga una ley de Student, por lo que hemos de recurrir a la siguiente tabla proporcionada por Young (1941) donde se ofrecen los valores críticos al 5% y 1%. Obsérvese que justamente hasta 8 observaciones pueden ser suficientes para comprobar la tendencia de una determinada serie.
[pic 6]
3.- Aplicación del estadístico C
El estadístico C solo sirve para determinar si una determinada serie presenta tendencia o no. Cuando se contemplan varias series, como sucede en una intervención clínica donde tenemos dos series, la anterior y la posterior al tratamiento, hemos de seguir las estrategias que exponemos a continuación:
1º.- Primeramente se aplica el estadístico C para comprobar si hay tendencia en la fase pre-tratamiento (o línea base). Si no hay tendencia, que es lo deseable, pasamos al punto 2º, y en caso de haber tendencia, al punto 3º.
2º.- Se unen todos los valores de la serie de la línea base y de tratamiento formando una única serie, y se aplica con todos ello, de nuevo, el estadístico C. Si esta serie combinada no presenta tendencia, está claro que el tratamiento no ha supuesto ningún cambio. En caso contrario, si el total de los datos presenta tendencia, es indicativo de que ha habido cambio, y en consecuencia se entiende que el tratamiento ha sido efectivo.
3º.- Aquí nos situamos cuando ha habido tendencia en la fase previa a la intervención. Puede ocurrir que la misma tendencia se mantenga en la segunda fase o bien que cambie. En el primer caso el tratamiento no es efectivo y sí en el segundo. El procedimiento consiste (básicamente) en restar los valores de una serie respecto a la otra y comprobar si a la serie resultante presenta tendencia. A este respecto, hay dos alternativas, una menos potente y otra algo más. La menos potente consiste en restar uno a uno los valores de la segunda serie respecto a la primera, y la más potente, consiste, igualmente en calcular la diferencia entre las dos series, pero en lo que respecta a la línea base no se hace con las puntuaciones observadas, si no las estimadas mediante la regresión (los valores, la dependiente y el tiempo, la independiente). Con ello se consigue una mejor representación de la línea base en aras de evitar el efecto distorsionante de posibles valores atípicos.
...