Probabilidad
Enviado por monkey1410 • 18 de Julio de 2015 • 2.649 Palabras (11 Páginas) • 183 Visitas
UNIDAD I.
ESTADISTICA DESCRIPTIVA.
a) CONCEPTO.
¿Qué es la estadística descriptiva o para qué nos sirve?
Cuando necesitamos analizar un proceso cualquiera, es necesario tomar una muestra de datos del proceso en cuestión y a partir de los mismos obtener sus características tales como la media, la mediana, la moda, la desviación estándar, el rango, etc., también es necesario saber el tipo de distribución de probabilidad que tiene, así como también es necesario visualizar de forma objetiva el comportamiento de los datos al ser graficados de diversas formas, todo lo anterior es posible gracias a la estadística descriptiva.
¿Qué es una muestra?
Es una parte de los datos del proceso que se desea analizar, la cual debe de ser representativa del proceso en cuanto al número de elementos que contiene y en cuanto a lo que está ocurriendo en el proceso, esto último se logra tomando cada uno de los elementos de la muestra de forma aleatoria o totalmente al azar; para determinar el número de elementos idóneo en la muestra se hace uso de la inferencia estadística, por el momento no nos ocuparemos de ello debido a que esto se ve con detalle en cursos más avanzados de estadística.
NOTACION SUMATORIA
La sumatoria o sumatorio (llamada también notación sigma) es una operación matemática que se emplea para calcular la suma de muchos o infinitos sumandos.
La operación sumatoria se expresa con la letra griega sigma mayúscula Σ, y se representa así:
Expresión que se lee: "sumatoria de Xi, donde i toma los valores desde 1 hasta n".
i es el valor inicial, llamado límite inferior.
n es el valor final, llamado límite superior.
Pero necesariamente debe cumplirse que:
i ≤ n
Si la sumatoria abarca la totalidad de los valores, entonces no se anotan sus límites y su expresión se puede simplificar:
DATOS NO AGRUPADOS.
Medidas de tendencia central.
Se les llama medidas de tendencia central a la media aritmética, la mediana, la media geométrica, la moda, etc. debido a que al observar la distribución de los datos, estas tienden a estar localizadas generalmente en su parte central. A continuación definiremos algunas medidas de tendencia central y la forma de calcular su valor.
1) Media aritmética (x ). También se le conoce como promedio ya que es el promedio de las lecturas o mediciones individuales que se tienen en la muestra, se determina con la fórmula siguiente:
Mediana (xmed). La mediana es aquel valor que se encuentra en la parte central de los datos que se tienen en la muestra una vez que estos han sido ordenados según su valor o magnitud. Para calcular la mediana se presentan dos casos:
a. Cuando el número de datos en la muestra es impar.- En este caso después de ordenar los datos de la muestra en cuanto a su magnitud, es decir de mayor a menor valor o de menor a mayor valor, se procede a localizar aquel dato que se encuentra justo en el centro de los datos o en la parte central de los mismos, el valor de este dato será el que dé valor a la mediana.
Moda (xmod). La moda se define como aquel valor o valores que más se repiten o que tienen mayor frecuencia entre los datos que se han obtenido en una muestra, la muestra de una población nos genera la distribución de los datos una vez que estos se han graficado y en esta gráfica es posible observar la moda o modas de la misma, es por esto que una distribución de datos puede ser amodal (carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos modas) o polimodal (tiene más de dos modas).
Medidas de Dispersión.
Cuando se tiene una muestra de datos obtenida de una población cualquiera, es importante determinar sus medidas de tendencia central así como también es básico el determinar qué tan dispersos están los datos en la muestra, por lo que se hace necesario determinar su rango, la varianza, la desviación estándar, etc., ya que una excesiva variabilidad o dispersión en los datos indica la inestabilidad del proceso en análisis en la mayoría de los casos.
Rango o recorrido. El rango es la diferencia entre el valor mayor y el valor menor encontrado en la muestra, también se le denomina recorrido ya que nos dice entre que valores hace su recorrido la variable de interés; y se determina de la siguiente manera:
R = VM – Vm
Dónde:
R = rango o recorrido
VM = valor mayor en la muestra
Vm = valor menor en la muestra
Desviación absoluta media ( ). Esta medida de dispersión nos representa la diferencia absoluta promedio que existe entre cada dato que se encuentra en la muestra y la media de los datos y se determina de la siguiente manera:
Varianza o variancia (s2). Es el promedio de las diferencias elevadas al cuadrado entre cada valor que se tiene en la muestra (xi) y la media aritmética ( ) de los datos y se determina de la siguiente manera:
Dónde:
n es el número de datos en la muestra
Desviación estándar (s). Es la desviación o diferencia promedio que existe entre cada dato de la muestra y la media aritmética de la muestra. Y se obtiene a partir de la varianza, sacándole raíz cuadrada.
Dónde:
s2= varianza o variancia
MEDIDAS DE LOCALIZACION
Cuartiles
Medida de localización que divide la población o muestra en cuatro partes iguales.
*Q1= Valor de la variable que deja a la izquierda el 25% de la distribución. *Q2= Valor de la variable que deja a la izquierda el 50% de la distribución = mediana. *Q3= Valor de la variable que deja a la izquierda el 75% de la distribución.
DATOS AGRUPADOS.
Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.
Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos cómo se agrupan los datos.
...