MANUAL BASICO DE ESTADISTICA
Enviado por Conduescolar • 19 de Abril de 2014 • 3.480 Palabras (14 Páginas) • 350 Visitas
ORGANIZACIÓN DE DATOS , ORDENADOS, EN INTERVALOS DE CLASE.
Muestra al azar sobre la estatura en centímetros, de niños en una escuela:
107 111 111 112 112 113 113 113 114 114 115 115 116 116 116 117 117 117 117 118 118 118 118 119 119 119 119 120 120 120 120 121 121 121 121 121 122 122 122 122 123 123 123 123 124 124 124 124 125 125 125 126 126 126 127 127 128 128 129 129 130 130 133 135
Tabla 1
Estatura
(Y) Numero de muestras (f) Acumulado
(N)
107 1 1
111 2 3
112 2 5
113 3 8
114 2 10
115 2 12
116 3 15
117 4 19
118 4 23
119 4 27
120 4 31
121 5 36
122 4 40
123 4 44
124 4 48
125 3 51
126 3 54
127 2 56
128 2 58
129 2 60
130 2 62
133 1 63
135 1 64
1. Rango: Es la diferencia entre el valor mayor de los datos y el menor. Rango = 135 - 107 = 28
2. Intervalo de clase (K), se eligen de forma que las marcas de clase o puntos medios coincidan con datos realmente observados. Esto tiende a aminorar el llamado error de agrupamiento.
O fórmula de sturges: K = 1 + 3.3 x log N donde N = Número de datos N=64
K = 1 + 3.3 (log 64) = 6.96 (aproximamos a 7) K=7
3. Ancho de clase ( C ): Debe ser no menor de 5 y no mayor a 15 o 20, C=Rango/K.
El ancho de clase debe estar en un rango no menor de 5 y no mayor de 15 o 20.
C = 28/7 C= 4, (se ajusta a 5)
Límites extremos inferior y superior de los intervalos
Nuevo rango = (número de intervalos) x (ancho de clase)
Nuevo rango = 7 x 5 = 35
Ahora se tiene: rango nuevo - rango original : 35 - 28 = 7 (diferencia)
Cuando los datos son enteros, a la diferencia se le resta 1
Diferencia 7 -1 = 6 se resta 1, para justificar en el paso 3.
Este numero 6 se reparte entre el rango inferior (restando) y el superior (sumando), teniendo en cuenta si es par o impar, asi:
Rango inicial: superior = 135 inferior = 107
Diferencia -1 Rango inferior Rango superior
0 107 135
1 106 (resta 1) 135
2 106 (resta 1) 136 (suma 1)
3 105 (resta 2) 136 (suma 1)
4 105 (resta 2) 137 (suma 2)
5 104 (resta 3) 137 (suma 2)
6 104 (resta 3) 138 (suma 3)
y así sucesivamente.
4. Marca de clase. Es el punto medio del intervalo de clase y se obtiene sumando los limites inferior y superior de la clase y dividiendo por 2.
5. Limites reales de clase. Se obtienen sumando al limite superior de un intervalo de clase el limite inferior del intervalo de clase contiguo superior y dividiendo por 2.
Ejemplo. De acuerdo al ejemplo citado, encontremos cada uno de estos conceptos.
1. Rango: 135 – 107 = 28
2. Intervalo de clase: Si utilizamos (al azar) 5 intervalos de clase, el tamaño de cada uno será: 28/5 = 6 aproximadamente. Si utilizamos 15 intervalos de clase, el tamaño de cada uno será: 28/15 = 2 aproximadamente.
3. Ancho de clase: Considerando tomar como intervalo de clase 6. entonces el ancho sera: 28/6 = 5 aproximadamente
Tomando 6 intervalos de clase y ancho 5, los datos estarán distribuidos:
Intervalos Frecuencia
107 - 111 3
112 - 116 12
117 - 121 21
122 - 126 18
127 - 131 8
132 - 136 2
4. Marca de clase: (107+111)/2 = 109. Si consideramos, por ejemplo, tomar como marca de clase 108, 113, 118, ... los datos se pueden agrupar:
Intervalos Frecuencia
106 - 110 1
111 - 115 11
116 - 120 19
121 - 125 20
126 - 130 11
131 - 135 2
5. Límite reales de clase: (105+106)/2 = 105.5 , (110+111)/2 = 110.5, y asi sucesivamente. Los limetes reales de clase estaran dados como:
Intervalo Frecuencia
105.5 – 110.5
110.5 - 115.5
..
Estos rangos no seran lo mas representativos, dado a que no coinciden exactamente con los datos observados.
5. MEDIDAS DE TENDENCIA CENTRAL.
Las medidas de tendencia central son valores que generalmente tienden a ubicarse hacia el centro de una distribución. Las tres medidas más frecuentes de tendencia central son media, mediana y moda.
5.1 MEDIA o PROMEDIO.
Es un valor que tiende a situarse en el centro del conjunto de datos ordenados segun su magnitud. Es equivalente a dividir la suma de todos los puntajes, entre el número total de éstos, en la distribución.
Para el ejemplo: X = (107+111+111+....) = 7724/64 = 120.69
Realizar estas operaciones, haciendo uso de papel y lápiz o de una calculadora normal, sería bastante dispendioso. Haga uso de la hoja electronica Excel, digite estos mismos datos en una columna cualquiera, por ejemplo a partir de la celda A1.
A
1 107
2 111
3 112
.. ...
64 135
65 =PROMEDIO(B2:B65)
En la celda A65 haga uso de la funcion PROMEDIO. Obtendrá el resultado esperado.
Para datos agrupados: (haga uso de la hoja electronica)
o X = mifi/ N en donde
mi = marca de clase de la i-esima clase
fi = frecuencia de la i-esima clase
Tabla 2
Intervalo
Yj-1 – Yj Marca de clase (m) Frecuencia (f) mf f. Acumula (N)
107 – 111 109 3 327 3
112 – 116 114 12 1,368 15
117 – 121 119 21 2,499 36
122 – 126 124 18 2,232 54
127 – 131 129 8 1,032 62
132 – 136 134 2 268 64
Suma 64 7,726
Media 120.72
Metodo abreviado. o X = A + difi/ N
Otra forma de obtener la media, cuando los intervalos de clase son iguales. Se toma una media supuesta (A) aquella marca de clase que tenga mayor numero de frecuencias (aunque se puede tomar cualquiera), luego se toman las diferencias de cada marca con respecto a esta (A).
Marca de clase (m) Diferencias d=X-A Frecuencia (f) df
109 -10 3 -30
114 -5 12 -60
A 119 0 21 -
124 5 18 90
129 10 8 80
134 15 2 30
Suma 64 110
Media 1.72
o X = mifi/ N = 119 + 1.72 = 120.72
5.2 MEDIANA.
Es el valor medio o la media artimética de los valores ordenados en orden de magnitud. Un 50% de los puntajes quedan encima de la mediana, y 50% por debajo. Si los puntajes suman un número par, la mediana es el promedio de los dos puntajes centrales, y por lo tanto ninguno puede atribuirsela. Si embargo si la suma de los puntajes es impar, la mediana sólo es el puntaje central.
Ejemplo:
3,4,4,5,6,8,8,8,10 la mediana es 6 ( Número de datos impares)
...