Estadística Descriptiva
Enviado por AC2RM1 • 4 de Febrero de 2012 • 2.842 Palabras (12 Páginas) • 1.030 Visitas
U T: I Estadística Descriptiva
Ensayo
UT I: ESTADÍSTICA DESCRIPTIVA.
Objetivo: Aplicar los conceptos de la estadística descriptiva del área mercadológica para organizar datos y calcular medidas de tendencia central de dispersión y curtosis, en un caso práctico.
1.1 Recopilación de datos.
1.1.1 Agrupados, no agrupados
Aunque las medidas de tendencia central y de dispersión calculadas a partir de una tabla de distribución de frecuencia no son tan precisas como las calculadas con los datos originales, y en ocasiones no se cuenta con éstos o es impráctico procesarlos, por lo que deben aplicarse las fórmulas aproximadas correspondientes a la medida que se desee, utilizando los datos de una tabla de distribución en frecuencias.
La media, la mediana y la moda de datos agrupados son los mismos conceptos que cuando se aplican a datos individuales, aunque su cálculo es más complejo y su exactitud es sólo aproximada en comparación con el cálculo basado en los datos individuales.
Los datos no agrupados es un conjunto de información si ningún orden que no nos establece relación clara con lo que se pretende desarrollar a lo largo de un problema, esto se soluciona mediante una tabulación que nos conduce a una tabla de frecuencias.
¿A qué se refiere esto? Cuando la muestra que se ha tomado de la población o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.
1.2 Ordenación y clasificación
1.2.1 N° de intervalos de clase
Los intervalos de clase se emplean si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Los intervalos de clase también tienen otras características como lo son:
Los límites de la clase, cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase, la amplitud de la clase que es la diferencia entre el límite superior e inferior de la clase y por último la marca de clase que es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
1.2.2 Tamaño de intervalo.
El tamaño o la amplitud de un intervalo de clase es la diferencia entre los límites superior e inferior y se le conoce como amplitud, tamaño o longitud de clase. Es igual a la diferencia entre los dos límites.
Son divisiones o categorías en las cuales se agrupan un conjunto de datos ordenados con características comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos limites.
Para organizar los valores de la serie de datos hay que determinar un número de clases que sea conveniente. En otras palabras, que ese número de intervalos no origine un número pequeño de clases ni muy grande. Un número de clases pequeño puede ocultar la naturaleza natural de los valores y un número muy alto puede provocar demasiados detalles como para observar alguna información de gran utilidad en la investigación.
Los intervalos de clase pueden ser de tres tipos, según el tamaño que estos presenten en una distribución de frecuencia:
• Clases de igual tamaño
• Clases desiguales de tamaño
• Clases abiertas
La amplitud o longitud de una clase es el número de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras Ic. Existen diversos criterios para determinar la amplitud de clases, ante esa diversidad de criterios, se ha considerado que lo más importante es dar un ancho o longitud de clase a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la práctica.
1.2.3 Distribución de datos
En estadística, se denomina distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas llamadas tablas de frecuencias o también conocida como tabla de relaciones de espermas, es una tabla en la que se organizan los datos en clases, es decir, en grupos de valores que escriben una característica de los datos y muestra el número de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico.
1.3 Estudio descriptivo
1.3.1 Medidas de tendencia central (media, moda, mediana, media ponderada.)
Las medidas de tendencia central son indicadores estadísticos que muestran hacia qué valor o valores se agrupan los datos. Este tipo de medidas nos permiten identificar y ubicar el punto o valor alrededor del cual se tienden a reunir los datos “Punto central”. Las técnicas de la medida de tendencia central que podemos utilizar son:
La media aritmética que es el promedio de un conjunto de datos y se obtiene por medio del cociente entre la suma de los datos y el número de ellos.
Por ejemplo, si se tuvieran los siguientes datos 10, 8, 6, 5, 10, 7 se suman todos nuestros datos y se dividen entre 6 que es el número total de datos y la media aritmética seria 8.
Otra técnica es la moda la cual es el valor que aparece con mayor frecuencia en la serie de datos. Así por ejemplo, de la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21.
Una técnica más de las medidas de tendencias central es la mediana, esta toma en cuenta la posición de los datos y se define como el valor central de una serie de datos.
El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina el valor central de la serie y esa es la mediana. Si el número de datos es par, existirán dos valores centrales y entonces la mediana se obtiene sacando el promedio de ellos.
Ejemplo:
7, 8, 8, 10, 12, 19, 23 Med = 10
3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5
En algunas ocasiones es importante obtener valores que dividan el conjunto de datos en fracciones específicas. Así como la mediana divide el conjunto de datos en dos partes iguales, es decir, la mitad de los valores son inferiores a la mediana y la otra mitad son superiores. Si
...