Unidad I Estadistica Descriptiva
Enviado por JUANJORDZ • 17 de Marzo de 2014 • 3.032 Palabras (13 Páginas) • 455 Visitas
La estadística como una de las ramas de la Matemática, nos ayuda a organizar la
información obtenida en la investigación de campo de una población o muestra.
Una manera de organizar esta información son las tablas de frecuencias. Las tablas de
frecuencia son una síntesis de la información que nos facilita su representación gráfica
en un histograma o polígono de frecuencias.
La gráfica nos facilita el análisis e interpretación de la información, la relación de los
parámetros de tendencia central: Moda (Mo), Mediana (Me) y Media (x) y la relación de
los parámetros de tendencia central con los de dispersión: Desviación media (DM);
Rango, Varianza (S2
) y desviación estándar (S).
Medidas de tendencia central.
Se les llama medidas de tendencia central a la media aritmética, la mediana, la media geométrica, la moda, etc. debido a que al observar la distribución de los datos, estas tienden a estar localizadas generalmente en su parte central. A continuación definiremos algunas medidas de tendencia central y la forma de calcular su valor.
Mediana (xmed). La mediana es aquel valor que se encuentra en la parte central de los datos que se tienen en la muestra una vez que estos han sido ordenados según su valor o magnitud. Para calcular la mediana se presentan dos casos:
a. Cuando el número de datos en la muestra es impar.- En este caso después de ordenar los datos de la muestra en cuanto a su magnitud, es decir de mayor a menor valor o de menor a mayor valor, se procede a localizar aquel dato que se encuentra justo en el centro de los datos o en la parte central de los mismos, el valor de este dato será el que dé valor a la mediana.
Nota: Es imprescindible para calcular el valor de la mediana el que primero se ordenen los datos en cuanto a su magnitud, ya que de no hacerlo, se incurriría en un grave error.
Moda (xmod). La moda se define como aquel valor o valores que más se repiten o que tienen mayor frecuencia entre los datos que se han obtenido en una muestra, la muestra de una población nos genera la distribución de los datos una vez que estos se han graficado y en esta gráfica es posible observar la moda o modas de la misma, es por esto que una distribución de datos puede ser amodal (carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos modas) o polimodal (tiene más de dos modas).
Medidas de Dispersión.
Cuando se tiene una muestra de datos obtenida de una población cualquiera, es importante determinar sus medidas de tendencia central así como también es básico el determinar que tan dispersos están los datos en la muestra, por lo que se hace necesario determinar su rango, la varianza, la desviación estándar, etc., ya que una excesiva variabilidad o dispersión en los datos indica la inestabilidad del proceso en análisis en la mayoría de los casos.
1) Rango o recorrido. El rango es la diferencia entre el valor mayor y el valor menor encontrados en la muestra, también se le denomina recorrido ya que nos dice entre que valores hace su recorrido la variable de interés; y se determina de la siguiente manera:
R = VM – Vm
Donde:
R = rango o recorrido
VM = valor mayor en la muestra
Vm = valor menor en la muestra
Desviación absoluta media ( ). Esta medida de dispersión nos representa la diferencia absoluta promedio que existe entre cada dato que se encuentra en la muestra y la media de los datos y se determina de la siguiente manera:
Varianza o variancia (s2). Es el promedio de las diferencias elevadas al cuadrado entre cada valor que se tiene en la muestra (xi) y la media aritmética ( ) de los datos y se determina de la siguiente manera:
) Desviación estándar (s). Es la desviación o diferencia promedio que existe entre cada dato de la muestra y la media aritmética de la muestra. Y se obtiene a partir de la varianza, sacándole raíz cuadrada.
donde:
s2= varianza o variancia
Por tanto la desviación estándar de la muestra anterior sería;
s =
La interpretación de este resultado sería, que la cantidad de glucosa encontrada en la muestra es en promedio de 14.86 miligramos y que la cantidad de glucosa en la muestra se aleja o dispersa en promedio 1.9704 mg alrededor de la media.
En este caso solo nos interesa conocer el significado de la desviación estándar, aunque es necesario decir que s es la desviación de la muestra y que s es la desviación de la población, así como s2 es la varianza de la muestra y s2 es la varianza de la población.
U N I D A D 1
Estadística Descriptiva
1.3 Distribuciones de frecuencias
Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencia
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.
[pic]
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
[pic]
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
[pic]
La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29,
...