Unidda 1 Estadistica Descriptiva
Enviado por 1193 • 12 de Noviembre de 2012 • 2.738 Palabras (11 Páginas) • 605 Visitas
UNIDAD 1:
ESTADISTICA DESCRIPTIVA.
INTRODUCCION, NOTACION SUMATORIA
Habitualmente el propósito de la Estadística Aplicada es el de sacar conclusiones de una población en estudio, examinando solamente una parte de ella denominada muestra.
Este proceso, denominado Inferencia Estadística, suele venir precedido de otro, denominado Estadística Descriptiva, en el que los datos son ordenados, resumidos y clasificados con objeto de tener una visión más precisa y conjunta de las observaciones, intentando descubrir de esta manera posibles relaciones entre los datos, viendo cuales toman valores parecidos, cuales difieren grandemente del resto, destacando hechos de posible interés, etc.
También están entre los objetivos de la Estadística Descriptiva el presentarlos de tal modo que permitan sugerir o aventurar cuestiones a analizar en mayor profundidad, así como estudiar si pueden mantenerse algunas suposiciones necesarias en determinadas inferencias como la de simetría,, normalidad, homocedasticidad, etc.
El propósito de este libro es el de dar conceptos y explicar técnicas que permitan realizar ambos procesos, a los cuales de forma conjunto se les suele denominar Análisis de Datos.
FUENTE: http://thales.cica.es/rd/Recursos/rd99/ed99-0278-01/est_des1.html
DATOS NO AGRUPADOS.
MEDIDAS DE TENDENCIA CENTRAL
Estadística sumaria.
Podemos usar una serie de números conocidos como estadística sumaria para describir las características del conjunto de datos. Dos de estas características son de particular importancia para los responsables de tomar decisiones: la de tendencia central y la de dispersión.
Tendencia central: la tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia central se conocen como medidas de posición.
Dispersión: se refiere a la extensión de los datos en una distribución, es decir, al grado en que las observaciones se distribuyen.
Sesgo: las curvas que representan los puntos de datos de un conjunto de datos pueden ser simétricas o sesgadas. Las curvas simétricas, tienen una forma tal que una línea vertical que pase por el punto más alto de la curva dividirá el área de ésta en dos partes iguales. Cada parte es una imagen espejo de la otra. En las curvas sesgadas, los valores de su distribución de frecuencias están concentrados en el extremo inferior o en el superior de la escala de medición del eje horizontal. Los valores no están igualmente distribuidos. Las curvas pueden estar sesgadas hacia la derecha (positivamente sesgadas) o sesgadas hacia la izquierda (negativamente sesgadas).
Curtosis: cuando medimos la curtosis de una distribución, estamos midiendo su grado de agudeza.
La media aritmética
Cuando nos referimos al "promedio" de algo, estamos hablando de la media aritmética.
Para encontrar la media aritmética, sumamos los valores y el resultado lo dividimos entre el número de observaciones.
Símbolos convencionales.
Una muestra de una población consiste en n observaciones, con una media de x (léase equis testada). Las medidas que calculamos para una muestra se conocen como estadística.
La notación es diferente cuando calculamos medidas para la población entera, es decir, para el grupo que contiene a todos los elementos que estamos describiendo. La media de una población se simboliza con μ (letra griega mi). El número de elementos de una población se denota con la letra mayúscula cursiva N. Por lo general, en estadística utilizamos letras del alfabeto latino para simbolizar la información sobre las muestras y letras del griego para referirnos a la información sobre poblaciones.
Cálculo de la media a partir de datos no agrupados.
Media de la población:
μ = ∑x / N
x = ∑x / n
Para calcular esta media, sumamos todas las observaciones. Los estadísticos se refieren a este tipo de datos como datos no agrupados.
Codificación:
Mediante esta técnica, podemos eliminar el problema de tener puntos medios muy grandes o inconvenientes. En lugar de utilizar los puntos medios reales para llevar a efecto nuestros cálculos, podemos asignar enteros consecutivos de valor pequeño, conocidos como códigos, a cada uno de los puntos medios. El entero cero puede ser asignado a cualquier punto medio, pero para que nuestros enteros sean pequeños, asignaremos cero al punto medio de la parte media de la distribución (o la parte más cercana a ésta). Podemos asignar enteros negativos a los valores menores a dicho punto medio y enteros positivos a los valores más grandes.
Los estadísticos usan xo para representar el punto medio al que se le ha asignado el código 0 y u para el punto medio codificado:
x = xo + w [(u f)] / n
w = ancho numérico del intervalo de clase
u = código asignado a cada punto medio de clase
Ventajas y desventajas de la media aritmética.
La media aritmética, en su carácter de un solo número que representa a un conjunto de datos completo, tiene importantes ventajas:
1. Se trata de un concepto familiar para la mayoría de las personas y es intuitivamente claro.
2. Cada conjunto de datos tiene una media, es una medida que puede calcularse y es única debido a que cada conjunto de datos posee una y sólo una media.
3. Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos.
Desventajas:
1. Puede verse afectada por valores extremos que no son representativos del resto de los datos.
2. Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato de nuestro cálculo.
3. Somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo abierto, ya sea en el inferior o en el superior de la escala.
La mediana
La mediana es un solo valor calculado a partir del conjunto de datos que mide la observación central de éstos. Esta sola observación es la más central o la que está más en medio en el conjunto de números. La mitad de los elementos están por encima de este punto y la otra mitad está por debajo.
Cálculo de la mediana a partir de datos no agrupados:
Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o ascendente. Si el conjunto de datos contiene un número impar de elementos, el de en medio en el arreglo es la mediana. Si hay un número par de observaciones, la mediana es el promedio de los dos elementos de en medio.
Mediana = (n + 1) / 2
Ventajas y desventajas de la mediana:
...