Estadística de la dispersión de la
Enviado por Luiz77 • 19 de Octubre de 2011 • Trabajo • 2.827 Palabras (12 Páginas) • 588 Visitas
Vanessa Paola Solano
Matemáticas II
Que es la estadística?
Es la rama de las matemáticas que se ocupa de reunir y organizar datos numéricos, que ayuden a resolver problemas como el diseño de experimentos y la toma de decisiones. Su finalidad es obtener información, analizarla, elaborarla y simplificarla lo más posible, para que pueda ser interpretada fácilmente, por tanto, pueda utilizarse para el fin que se desee.
Que estudia?
La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.
La Estadística se divide en dos ramas:
La estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de descriptores numéricos son la media y la desviación estándar. Resúmenes gráficos incluyen varios tipos de figuras y gráficos.
La inferencia estadística, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población de estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen ANOVA, series de tiempo y minería de datos.
Medidas de tendencia central
Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.[1] En este caso se incluyen también los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:
• Media aritmética.
• Media ponderada.
• Media geométrica.
• Media armónica.
• Mediana.
• Moda.
Medidas de dispercion
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la mediana media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).
Medida de tendencia central
Las medidas de tendencia central comúnmente empleadas son :
• Media aritmética
• Mediana
• Moda
• Media geométrica
• Media armónica
• Los cuantilos
Moda
La moda es el valor que aparece con mayor frecuencia en la serie de datos. Así por ejemplo, de la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21.
La moda es una medida muy natural para describir un conjunto de datos; su concepto se adquiere fácilmente : es la altura más corriente, es la velocidad más común, etc. Además tiene la ventaja de que no se ve afectada por la presencia de valores altos o bajos.
La principal limitación esta en el hecho de que requiere un número suficiente de observaciones para que se manifieste o se defina claramente.
Otros inconvenientes son que puede darse el caso de que una determinada serie no tenga moda o que tenga varias modas.
Por ejemplo :
L, K, M, O, N (no hay moda)
5, 6, 10, 5, 8, 6, 7, 4 (2 modas)
Mediana
La mediana toma en cuenta la posición de los datos y se define como el valor central de una serie de datos o, más específicamente, como un valor tal que no más de la mitad de las observaciones son menores que el y no más de la mitad mayores.
El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina el valor central de la serie y esa es la mediana. Si el número de datos es par, existirán dos valores centrales y entonces la mediana se obtiene sacando el promedio de ellos.
Por ejemplo :
7, 8, 8, 10, 12, 19, 23 Med = 10
3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5
Los Cuantilos
En algunas ocasiones es importante obtener valores que dividan el conjunto de datos en fracciones especificas. Así como la mediana divide el conjunto de datos en dos partes iguales, es decir, la mitad de los valores son inferiores a la mediana y la otra mitad son superiores. Si cada una de estas mitades se volviera a dividir por la mitad, el conjunto quedaría dividido en cuatro partes y cada parte se llamara cuartilo.
Pero el conjunto puede dividirse también por 10 (deciles) o por 100 (percentiles) y todos se llaman cuantilos.
Tanto la mediana, como los cuartilos y los deciles pueden expresarse como percentiles.
Por ejemplo:
Me = P50; Q3 = P75; D4 = P40
Así que conociendo los percentiles se puede averiguar cualquier cuantilo.
Para el calculo de los percentiles, el conjunto de datos debe estar ordenado, luego se aplica la siguiente formula :
Pm = m (n+1) termino
100
Donde : Pm = Percentil m. Valor tal que un m/100 de las observaciones son menores que el y un 1 - m/100 son mayores.
m = Número que indica el percentil que se quiere. Por ejemplo, si m = 43, esto quiere decir que se quiere el percentil 43 (P43).
n = Número total de observaciones.
Ejemplo :
Calcular el percentil 77 de los siguientes datos
...