Medidas de tendencia central y de posición
Enviado por gustavoo • 15 de Febrero de 2013 • Trabajo • 1.385 Palabras (6 Páginas) • 763 Visitas
1.2 Datos agrupados
1.2.1 Tabla de frecuencias
Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos cómo se agrupan los datos.
Cuando la muestra es grande es frecuente encontrar muchos valores de la variable y resulta poco práctico numerarlas todos, en estos casos resulta conveniente agrupar los valores en intervalos consecutivos llamados clases. Estos intervalos son de la forma [Li, Ls], cuyo extremo Li es el límite inferior de la clase y el extremo Ls es el límite superior de la clase.
No existe alguna ley que defina cómo obtener el número de clases; pero la experiencia recomienda que sean entre 5 y 20 clases.
Para construir una distribución de frecuencias en clases seguimos el siguiente procedimiento aplicado al ejemplo:
Los puntajes de un examen de ingreso a la universidad realizado por 40 alumnos son los siguientes:
110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115,110.
Paso 1.
Determinamos el rango (R) de variación de los datos que se define como R=x_max-x_min, donde x_maxes el dato máximo y x_min, es el dato mínimo.
Para el ejemplo x_min, = 140 y x_min = 90 entonces.
R=140-90=50
Paso 2.
Determinamos el número de intervalos o clases k.
Una forma de hacerlo es con la Regla de Sturges, donde: k = 1 + 3.3 log (n); donde n es el número de datos (se recomienda que sean más de 10).
Para el ejemplo se tiene n = 40 datos, sustituyendo
k = 1 + 3.3 log (40) = 1 + 3.3 (1.602) = 1 + 5.28 = 6.28, la cual se redondea al entero siguiente, en este caso k = 7.
Otra alternativa es usando la raíz cuadrada del total de datos n para este ejemplo nos queda así:
k = raíz (n) = raíz (40) = 6.32 que también se redondea al entero siguiente quedando k= 7.
Paso 3.
Calculamos la amplitud de clase (a), que corresponde a la cantidad de datos que van en casa clase, dividiendo el rango R entre el número de clases k: a=R/k.
Sustituyendo a=50/7=7.14 se redondea a 8
Paso 4.
Construimos los intervalos o clases, como la variable es cuantitativa discreta los intervalos o clases son cerrados, es decir de la forma [Li, Ls].
Para formar las clases comenzaremos con los limites inferiores:
• En la primer clase tomamos L_i1= x_min (el dato más pequeño)
• Para las demás clases el límite inferior se obtiene sumando la x_min con la amplitud, es decir
L_i n=L_i n-1+a. Para nuestro ejemplo x_min = 90 y a. = 8, entonces las 7 clases quedan:
Para obtener los límites superiores se toma el valor anterior al límite inferior de la clase siguiente, y se va sumando la amplitud a = 8
Finalmente ya podemos elaborar las clases con sus respectivas frecuencias, recordando que cada clase abarca todos los valores que van desde el límite inferior hasta el superior. Los puntajes de los 40 alumnos son:
110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.
Clases f
90 – 97 7
98 – 105 9
106 – 113 13
114 -121 3
122 -129 4
130 -137 3
138 - 145 1
Total 40
Marca de clase (Mi): corresponde al punto medio del intervalo, es una característica importante de cada clase ya que no cambia sin importar si la variable es discreta o continua, se calcula usando la fórmula:, se suman los límites de clase y el resultado se divide entre dos.
M_i=(L_i+ L_s)/2
Para nuestro ejemplo obtendríamos las siguientes marcas de clase:
Clases Mi f
90 – 97 93.5 7
98 – 105 101.5 9
106 – 113 109.5 13
114 -121 117.5 3
122 -129 125.5 4
130 -137 133.5 3
138 - 145 141.5 1
Total 40
1.2.2 Medidas de tendencia central y de posición
Tendencia central: La tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia central se denominan medidas de posición.
MEDIA ARITMÉTICA
Es el promedio de los datos
x ̅ Cuando sea para una muestra.
μ Cuando sea para una población.
x_i: Marcas de clases.
f_i: Frecuencias absolutas
MODA: Es la variable de la muestra que más se repite.
Los pasos son:
Ubicar la mayor f_i, para hallar el intervalo modal
Aplicar la fórmula
l_i: Límite inferior.
Δ_i: Es el valor que se obtiene de restar la f_i con la frecuencia anterior. (Δ_s=f_i - f_(i-1)).
Δ_s: Es el valor que se obtiene de restar la f_i con la frecuencia siguiente. (Δ_s=f_i - f_(i+1)).
a_: Amplitud del intervalo de clase.
Consideraciones:
Puede haber más de una moda cuando dos o más números se repiten la misma cantidad de veces. En este caso se estaría hablando de una muestra multimodal.
No hay moda si ningún número se repite más de una vez.
MEDIANA:
Es el valor que divide al conjunto ordenado de datos, en
...