Estadística de la dispersión de la

Luiz77Trabajo19 de Octubre de 2011

2.827 Palabras (12 Páginas)663 Visitas

Página 1 de 12

Vanessa Paola Solano

Matemáticas II

Que es la estadística?

Es la rama de las matemáticas que se ocupa de reunir y organizar datos numéricos, que ayuden a resolver problemas como el diseño de experimentos y la toma de decisiones. Su finalidad es obtener información, analizarla, elaborarla y simplificarla lo más posible, para que pueda ser interpretada fácilmente, por tanto, pueda utilizarse para el fin que se desee.

Que estudia?

La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.

La Estadística se divide en dos ramas:

La estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de descriptores numéricos son la media y la desviación estándar. Resúmenes gráficos incluyen varios tipos de figuras y gráficos.

La inferencia estadística, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población de estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen ANOVA, series de tiempo y minería de datos.

Medidas de tendencia central

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.[1] En este caso se incluyen también los cuantiles entre estas medidas.

Entre las medidas de tendencia central tenemos:

• Media aritmética.

• Media ponderada.

• Media geométrica.

• Media armónica.

• Mediana.

• Moda.

Medidas de dispercion

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la mediana media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).

Medida de tendencia central

Las medidas de tendencia central comúnmente empleadas son :

• Media aritmética

• Mediana

• Moda

• Media geométrica

• Media armónica

• Los cuantilos

Moda

La moda es el valor que aparece con mayor frecuencia en la serie de datos. Así por ejemplo, de la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21.

La moda es una medida muy natural para describir un conjunto de datos; su concepto se adquiere fácilmente : es la altura más corriente, es la velocidad más común, etc. Además tiene la ventaja de que no se ve afectada por la presencia de valores altos o bajos.

La principal limitación esta en el hecho de que requiere un número suficiente de observaciones para que se manifieste o se defina claramente.

Otros inconvenientes son que puede darse el caso de que una determinada serie no tenga moda o que tenga varias modas.

Por ejemplo :

L, K, M, O, N (no hay moda)

5, 6, 10, 5, 8, 6, 7, 4 (2 modas)

Mediana

La mediana toma en cuenta la posición de los datos y se define como el valor central de una serie de datos o, más específicamente, como un valor tal que no más de la mitad de las observaciones son menores que el y no más de la mitad mayores.

El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina el valor central de la serie y esa es la mediana. Si el número de datos es par, existirán dos valores centrales y entonces la mediana se obtiene sacando el promedio de ellos.

Por ejemplo :

7, 8, 8, 10, 12, 19, 23 Med = 10

3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5

Los Cuantilos

En algunas ocasiones es importante obtener valores que dividan el conjunto de datos en fracciones especificas. Así como la mediana divide el conjunto de datos en dos partes iguales, es decir, la mitad de los valores son inferiores a la mediana y la otra mitad son superiores. Si cada una de estas mitades se volviera a dividir por la mitad, el conjunto quedaría dividido en cuatro partes y cada parte se llamara cuartilo.

Pero el conjunto puede dividirse también por 10 (deciles) o por 100 (percentiles) y todos se llaman cuantilos.

Tanto la mediana, como los cuartilos y los deciles pueden expresarse como percentiles.

Por ejemplo:

Me = P50; Q3 = P75; D4 = P40

Así que conociendo los percentiles se puede averiguar cualquier cuantilo.

Para el calculo de los percentiles, el conjunto de datos debe estar ordenado, luego se aplica la siguiente formula :

Pm = m (n+1) termino

100

Donde : Pm = Percentil m. Valor tal que un m/100 de las observaciones son menores que el y un 1 - m/100 son mayores.

m = Número que indica el percentil que se quiere. Por ejemplo, si m = 43, esto quiere decir que se quiere el percentil 43 (P43).

n = Número total de observaciones.

Ejemplo :

Calcular el percentil 77 de los siguientes datos :

32, 35, 36, 37, 40, 40, 41, 41, 42, 43, 43, 44, 45, 45,

46, 46, 47, 47, 48, 49, 49, 50, 51, 51, 52, 53, 53, 54,

55, 56, 57, 59, 60, 60, 62, 66, 67, 68, 70, 74.

El percentil 77 (P77) será el valor que este ubicado en la 31. 57 posición del conjunto de datos, pero esta posición no existe y entonces hay que hacer una extrapolación entre los datos 31° y 32°.

El 31° dato corresponde a 57 mientras que el 32° dato corresponde a 59, entonces diremos que el P77 es un 57% de 59 más un 43% de 57.

P77 = (0.43 * 57) + (0.57 * 59) = 58.14

Media Aritmética

La media aritmética es el promedio más comúnmente usado, este puede ser simple o ponderado.

La media aritmética simple esta dada por la formula SX/n y que significa: la suma de todos los valores dividida por el número de datos.

Por ejemplo:

10, 13, 10, 13, 14, 10, 13, 10, 15

Media Aritmética Ponderada

Si los valores que toma x en una serie de datos, no todos tienen la misma importancia, es valido asignar "pesos" o "ponderaciones" de acuerdo a la importancia de cada dato.

En la serie del ejemplo anterior aparecen los números; pero cada uno con diferente frecuencia. Si cada uno de estos datos se multiplica por su respectiva frecuencia o ponderación y se suman estos productos, se obtendrá la misma suma que si se hubieran sumado uno por uno.

Sin ponderar Cálculo ponderado

Número x Número x Frecuencia Producto (fx)

10 10 4 40

13 13 3 39

14 14 1 14

15 15 1 15

Suma = 52 9 108

52/4 = 13 108/9 = 12

Media Geométrica

La media geométrica es la raíz enésima del producto de todos los valores de la serie.

Así por ejemplo la media geométrica de 3,4,9 y 12 seria:

Como este sistema de calculo resulta muy difícil de emplear, máxime cuando son números grandes o largas series de datos, en la práctica se recurre a los logaritmos.

xg = antilog (S

...

Descargar como (para miembros actualizados) txt (16 Kb)

Leer 11 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com