Medidas Descriptivas
Enviado por maka9suazo • 4 de Julio de 2013 • 4.146 Palabras (17 Páginas) • 535 Visitas
MEDIDAS DESCRIPTIVAS
Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen la información contenida en ella.
- Centralización o tendencia central: Media, mediana, moda.
- Dispersión: indica la mayor o menor centralización de los datos con
respecto a las medidas de centralización.
Medidas
Varianza, desviación típica o desviación estándar, coeficiente de variación, amplitud o rango.
Descriptivas
- Posición: dividen un conjunto de datos en grupos con la misma cantidad de individuos.
Cuartiles, quintiles, deciles, percentiles.
- Forma:
Asimetría, apuntamiento.
MEDIDAS DE CENTRALIZACIÓN
Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos.
MEDIA: (media aritmética o simplemente media) es el promedio aritmético de las observaciones, es decir, el cociente entre la suma de todos los datos y el número de ellos. Si xi es el valor de la variable, tenemos que:
Si los datos están agrupados utilizamos las marcas de clase, es decir ci en vez de xi.
MEDIANA: (Me): es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par tomaremos como mediana la media aritmética de los dos valores centrales.
MODA (M0): es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser única. En un conjunto de datos puede no haber moda si ningún dato se repite.
Construcción de tablas para datos agrupados
Si el conjunto de datos que se recolecta es muy numeroso, o bien, si el rango (diferencia entre el mayor y menor valor de una variable) es muy amplio, es usual presentarlos agrupados y ordenados en intervalos (rango de valores).
Tamaño de intervalo
El tamaño de cada intervalo se puede calcular dividiendo el valor del rango por la cantidad de intervalos que se desean obtener.
Ejemplo
Un grupo de 20 pacientes entre 40 y 50 años se realizaron un examen para medir su nivel de colesterol (en mg/dl).
Los resultados obtenidos fueron los siguientes:
Como se puede observar, los valores de la variable de estudio (nivel de colesterol) presentan un rango amplio (174 a 228). Por lo tanto, agruparemos los datos en 6 intervalos de tamaño 9, ya que:
La tabla de frecuencias correspondiente es:
Con este tipo de tabla preguntas como:
• ¿Cuántos pacientes tienen una medición entre 180 mg/dl y 189 mg/dl?
_____________________________________________________________
• ¿Cuántos pacientes tienen mediciones menores o iguales que a 199 mg/dl?
______________________________________________________________
• ¿Cuál es la probabilidad de que un paciente tenga una medición entre 200 mg/dl y 209 mg/dl?
______________________________________________________________
Media aritmética y moda para datos agrupados
La siguiente tabla de distribución de frecuencias muestra la puntuación obtenida por 1.500 alumnos de 5º a 8º Básico en un cuestionario acerca de lo que significa el Bicentenario en nuestro país.
¿Cuál es el promedio de puntaje obtenido en el cuestionario por los alumnos?
Para calcular el promedio de una tabla para datos agrupados, se busca un representante de cada intervalo o clase. Este representante es el promedio de los extremos del intervalo y se conoce como marca de clase. Observa y verifica los valores obtenidos:
Luego, el promedio se calcula sumando los productos de cada marca de clase por su frecuencia absoluta respectiva (cantidad de alumnos), y dividiendo por el total de alumnos
Luego, el promedio es 22,67. ¿Es razonable el valor obtenido?
Observamos que la mayor cantidad de alumnos se da en el intervalo 22 – 32 (categoría “regular”). Como el promedio obtenido se encuentra dentro de este rango, podemos decir que es bastante adecuado para representar un valor central en torno al cual se concentran la mayoría de los alumnos del curso. Puedes verificar que el 50% de los alumnos se concentraron entre los intervalos “Muy bajo” y “Bajo”.
Para calcular la media aritmética (x) para datos agrupados, sumamos todos los productos de cada marca de clase con la frecuencia absoluta respectiva y esta suma se divide por el número total de datos.
Sabemos calcular la moda para datos no agrupados. (Dato que más se repite).
Aprenderemos a obtener la moda para datos agrupados. Podemos seguir los siguientes pasos:
1º Identificar cuál es el intervalo en donde se encuentra la mayor frecuencia absoluta, a este intervalo le llamaremos intervalo modal. En nuestro ejemplo, el intervalo modal corresponde a 22 – 32, con una frecuencia de 420 alumnos.
2º Identificar las frecuencias absolutas del intervalo anterior y posterior al intervalo modal. En el ejemplo, el intervalo anterior corresponde a 11 – 21 con una frecuencia de 400 alumnos, y el intervalo posterior a 33 – 43, con una frecuencia de 200 alumnos.
3º Obtener diferencia de la frecuencia del intervalo modal y la frecuencia de clase anterior (d1). Entonces tenemos, 420 – 400 = 20.
4º Obtener diferencia de la frecuencia del intervalo modal y la frecuencia de clase posterior (d2). Entonces tenemos, 420 – 200 = 220.
5º Obtener el tamaño de los intervalos (t: debe ser constante). El tamaño de los intervalos es 10.
6º Obtener el número que representa el extremo inferior de la clase modal (Li). En el ejemplo, corresponde a 22.
Luego, el cálculo de la moda (Mo) está
...