MEDIDAS ESTADÍSTICAS
Enviado por simendoza • 6 de Noviembre de 2013 • 2.175 Palabras (9 Páginas) • 374 Visitas
TEMA 2: MEDIDAS ESTADÍSTICAS
1. INTRODUCCIÓN
En numerosas ocasiones, en vez de trabajar con todos los datos, es preferible disponer de una o más medidas descriptivas que resumen los datos de forma cuantitativa. Estas medidas se llaman parámetros (a veces se utiliza el término estadístico cuando nos referimos a una muestra). La Estadística descriptiva es la rama de la Estadística que se encarga del recuento, ordenación y clasificación de los datos y es la que define y calcula los parámetros estadísticos que caracterizan la distribución. Se trata, pues, de resumir en unos cuantos valores la información más importante y útil contenida en un conjunto de datos, haciendo más fácil la comprensión y la comparación de las diversas características de las poblaciones o muestras.
2. MEDIDAS DE POSICIÓN
A continuación estudiaremos diferentes parámetros estadísticos que nos permitirán conocer la tendencia posicional de los datos. Veremos en primer lugar medidas de tendencia central y posteriormente otras medidas alusivas igualmente a la posición.
a) Medidas de centralización
* Media.
A veces se llama también media aritmética, valor medio, promedio o promedio aritmético.
Consideramos una variable estadística discreta cuya distribución de frecuencias es
Se define la media aritmética como:
Si consideramos una variable estadística continua cuya distribución de frecuencias es la media se calcula suponiendo que todos los datos de cada intervalo son idénticos al centro o marca de la clase.
La media será:
El sentido de la media es el de”repartir” equitativamente la suma total de los datos entre los individuos de la muestra.
* Moda.
Se define como el valor de la variable estadística que tiene mayor frecuencia, es decir:
si
Cuando la variable sea continua hablaremos del intervalo modal como aquel que presenta mayor frecuencia absoluta.
Calculo de la moda:
En variables discretas basta con identificar el valor con la mayor frecuencia absoluta.
En variables continuas, una vez identificado el intervalo modal, algunos autores toman la marca de la clase de dicho intervalo como moda, si bien, es habitual calcular la moda mediante la siguiente fórmula:
donde es el intervalo modal y c la amplitud
Observaciones:
La moda no tiene por qué ser única, Puede haber más de un valor de la variable con la mayor frecuencia. En este caso se dirá que la distribución es bimodal, trimodal,...
*Mediana.
Dado un conjunto de observaciones, ordenadas de menor a mayor, la mediana Me es una observación que divide esta ordenación en dos partes, con el mismo nº de datos en cada una.
Es decir, el nº de observaciones menores que la mediana es igual al nº de observaciones mayores que ella.
Cálculo de la mediana
Distribuciones unitarias: - Si n es impar, será el valor central de la distribución ordenada.
- Si n es par, será la suma de los valores centrales entre 2.
Distribuciones no unitarias: - Si supera a , será el correspondiente a ese .
- Si = , será la media aritmética entre y .
Distribuciones agrupadas: - Si supera a
- Si = es el límite superior del intervalo.
b) Otras medidas de posición
Análogamente a la mediana, que divide los datos en dos partes iguales, se definen otras medidas que dividirán los datos en cuatro, diez o cien partes.
• Se denominan cuartiles a tres valores Q , Q , Q que dividen la serie ordenada de datos en cuatro partes iguales.
• Se denomina deciles a nueve valores D ,....D que dividen la serie ordenada de datos en diez partes iguales.
• Se denominan percentiles a los 99 valores P ,.....P que dividen la serie ordenada de datos en 100 partes iguales.
Se definen genéricamente como cuantiles a los cuartiles, deciles, percentiles,.....Los cuantiles de denominan también parámetros de estructuras y son muy utilizados en las CC.Sociales.
3. MEDIDAS DE DISPERSIÓN
Las medidas de posición central no proporcionan, en general, suficiente información para una adecuada descripción de los datos, porque no toman en cuanta la dispersión o concentración de los mismos, por lo tanto es claro que se requieren otras medidas que indiquen el grado de variabilidad de los datos.
Estas medidas son necesarias para efectuar comparaciones significativas entre grupos de observaciones. Cuando se mide la dispersión de los valores de una variable respecto de unas de sus medidas de posición, se está midiendo el grado de representatividad que dicha medida de posición tiene en el conjunto de los datos a los cuales pretende resumir.
a) Recorrido
Es una medida, aunque imperfecta, de la dispersión de los datos. Se define como la diferencia entre el mayor y el menor valor de la variable. A veces se llama también rango.
Si x , x ,....., x son los valores de la variable ordenados, el recorrido es: R = - x
b) Varianza
Dada una variable estadística discreta x, cuya distribución de frecuencias relativas
es: y media , se define la varianza de la v. estadística X , y la denotaremos por v(x) o , como el promedio de los cuadrados de las desviaciones de los valores de la variable a su media, es decir:
Para variables estadísticas continuas o discretas donde los valores estén agrupados en intervalos, se define de manera análoga sin más que cambiar los valores x por las marcas de clase correspondientes a cada intervalo de clase.
c) Desviación típica
Dada una variable estadística x con media y varianza , se define la desviación típica como la raíz cuadrada positiva de la varianza.
d) Coeficiente de variación de Pearson
El coeficiente de variación de Pearson se define como el cociente entre la desviación típica y la media
Aquella población que tenga el coeficiente
...