PRUEBA DE KOLMOGOROV EJEMPLO REAL
Enviado por jjum2593 • 28 de Mayo de 2014 • 993 Palabras (4 Páginas) • 844 Visitas
INTRODUCCIÓN
La estadística es una ciencia que permite por métodos recopilar, extraer datos de los cuales determinaremos las medidas estadísticas.
En este caso consiste en la determinación de cuánto tiempo se demoraba en llegar un bus del metropolitano a la estación sea cual fuere la línea en el primer caso, mientras que para el segundo caso determinar el tiempo de espera de una persona para una línea determinada, todo ello para dar una explicación a la diferencia de tiempos que existe en los casos mencionados.
MARCO TEÓRICO
La prueba de Kolmogorov-Smirnov (también llamada prueba K-S) para una muestra se considera un procedimiento de "bondad de ajuste", es decir, permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una distribución teórica específica
Mediante la prueba se compara la distribución acumulada de las frecuencias teóricas con la distribución acumulada de las frecuencias observadas, se encuentra el punto de divergencia máxima y se determina qué probabilidad existe de que una diferencia de esa magnitud se deba al azar.
Figura1
OBJETIVO
El objetivo de esta prueba de bondad de ajuste es señalar y determinar si los datos estudiados o mediciones muéstrales provienen de una población que tiene una distribución teórica determinada.
Método:
1. Se identifica la muestra de la población a la que se le aplicara la prueba de Kolmogorov.
2. Se plantea una prueba de hipótesis a esa muestra, es decir, se plantean dos hipótesis.
H0: Los datos analizados siguen una distribución M.
H1: Los datos analizados no siguen una distribución M.
3. Se calcula la probabilidad acumulada observada (Fo(xi)) de cada uno de los intervalos, al final la suma de las probabilidades acumuladas observadas debe ser igual a 100.
4. Se calcula la probabilidad acumulada esperada o teórica (Fn(xi)).
Luego hallamos el estimador de prueba (D), de esta manera:
D+= Fo(xi) - Fn(xi), tomamos el máximo
D- = Fn(xi) - Fo(xi-1), tomamos el máximo
Dónde:
Xies el i-ésimo valor observado en la muestra (cuyos valores se han ordenado previamente de menor a mayor).
A partir de estos valores:
D = máximo [D+, D-]
5. Calculamos el valor de Dα, que depende del tipo de distribución a probar, para esto definimos nuestro α que viene ha ser el nivel de significación.
Dα=C_α/(K(n))
Donde los valores de C_α y K(n) se encuentran con las siguientes tablas:
Tabla (1)
Tabla (2)
6. Si el estimador de la prueba (D) es menor que el valor Dα entonces se acepta la hipótesis Ho planteada antes de estudiar la muestra, de lo contrario se acepta la hipótesis alternativa H1.
MÉTODOS
CASO I
Registrar el tiempo exacto de llegada de cada bus del metropolitano asignada según los horarios establecidos; y en un solo sentido (todas las líneas que viajen en dicho sentido). El tiempo se registra en segundos a partir del inicio de la toma de muestra.
Tamaño de muestra mínimo: 30.
Toma de datos
Estación : Honorio Delgado
Hora: 19:18
Provenían del Sur y se dirigían al Norte
A B
00:20 08:09
03:30 12:14
18:17 13:25
19:20 16:04
28:12 18:00
28:40 27:23
29:20 28:03
30:10 28:07
31:20 32:11
31:58 32:25
32:19 38:11
32:40 39:26
40:08 40:15
40:37 42:12
47:26 50:07
50:02
Tabla (3)
T ∆T ∆T(s)
00:20 03:10 190
03:30 04:39 279
08:09 04:05 245
12:14 01:11 71
13:25 02:39 159
16:04 01:56 116
18:00 00:17 17
18:17 01:03 63
19:20 08:03 483
27:23 00:40 40
28:03 00:04 4
28:07 00:05 5
28:12 00:28 28
28:40 00:40 40
29:20 00:50 50
30:10 01:10 70
31:20 00:38 38
31:58 00:13 13
32:11 00:08 8
32:19 00:06 6
32:25 00:15 15
32:40 05:31 331
38:11 01:15 75
39:26 00:42 42
40:08 00:07 7
40:15 00:22 22
40:37 01:35 95
42:12 05:14 314
47:26 02:41 161
50:02 00:05 5
Tabla (4)
Procedimiento
Ordenamos los valores de menor a mayor los intervalos de tiempo (∆T), que estarán representadas en la variable Y, la cantidad de datos por la variable X.
X Y
1 4
2 5
3 5
4 6
5 7
6 8
7 13
8 15
9 17
10 22
11 28
12 38
13 40
14 40
15 42
16 50
17 63
18 70
19 71
20 75
21 95
22 116
23 159
24 161
25 190
26 245
27 279
28 314
29 331
30 483
Tabla (5)
Calcular:
Intervalo tiempo medio entre arribos consecutivos
X ̅=(∑▒Y)/n
"Y:intervalos de tiempo"
"n:cantidad de datos"
"x:tiempo medio"
X ̅=99.73
Moda de los datos
M_0=5 y 40
Mediana de los datos
M_e=56.5
Desviación estándar
S=√((∑▒("X-" "X" ̅ )^"2" )/"n" )
S=118.5
Coeficiente de variación
CV=1.188
APLICACIÓN DEL MÉTODO:
CASO I
Registrar el tiempo exacto de llegada de cada bus del metropolitano asignada según los horarios establecidos; y en un solo sentido (todas las líneas que viajen en dicho sentido). El tiempo se registra en segundos a partir del inicio de la toma de muestra.
Tamaño de muestra mínimo: 30
Toma de datos
Estación : Honorio Delgado
Hora: 19:18
Provenían del Sur y se dirigían al Norte
A B
00:20 08:09
03:30 12:14
18:17 13:25
...