PROBABILIDAD Y ESTADISTICA
Enviado por ISACOAS • 20 de Noviembre de 2013 • 3.354 Palabras (14 Páginas) • 370 Visitas
UNIDAD I
ESTADÍSTICA
ESTADISTICA.- Rama de las matemáticas que se ocupa de reunir, organizar y analizar datos numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones.
La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad, y es usada para la toma de decisiones en áreas de negocios e instituciones gubernamentales.
La Estadística se divide en dos ramas:
La estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, etc.
La inferencia estadística, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen ANOVA, series de tiempo y minería de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. Hay también una disciplina llamada estadística matemática, la cual se refiere a las bases teóricas de la materia. La palabra estadísticas también se refiere al resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas criminales, etc.
RECOPILACIÓN DE DATOS
Se les llama datos sueltos a los datos recolectados que no han sido organizados numéricamente.
DISTRIBUCIÓN DE FRECUENCIA
Si se reúnen grandes cantidades de datos sueltos es útil distribuirlos en clases o categorías y determinar el número de individuos que pertenecen a cada categoría, a lo que se le llama frecuencia de clase. A una disposición tabular de los datos por clases, con sus correspondientes frecuencias de clase, se le conoce como distribución de frecuencia o tabla de frecuencias.
INTERVALOS DE CLASE Y LÍMITES DE CLASE
El símbolo que define una clase, como el 60–62 se llama intervalo de clase. A los números 60 y 62 se les conoce como limites de clase; el numero mas pequeño (60) es el limite inferior de clase, mientras que el numero mas grande (62) es el limite superior de clase. Se acostumbra usar los términos clase e intervalo de clase indistintamente, aunque el intervalo de clase es en realidad un símbolo de la clase.
A un intervalo de clase que, por lo menos teóricamente, no tiene límite de clase inferior o límite de clase superior se le llama intervalo de clase abierto. Por ejemplo, en grupos de edades de individuos, el intervalo de clase “65 años a mas” es un intervalo de clase abierto”
FRONTERAS DE CLASE
Si se miden estaturas con exactitud de 1 pulg., en teoría el intervalo de clase 60–62 incluye todas las medidas desde 59.5000 hasta 62.5000 pulg. Estos números, indicados brevemente por los números exactos 59.5 y 62.5 se llaman fronteras de clase o limites verdaderos de clase; el numero menor (59.5) es la frontera inferior de clase y el numero mayor (62.5), la frontera superior de clase.
En la práctica, las fronteras de clase se obtienen promediando los límites superior e inferior de un intervalo de clase. Algunas veces se emplean las fronteras para simbolizar clases. Por ejemplo, las clases en la primera columna de la tabla 2–1 se podrían indicar mediante 59.5–62.5, 62.5–65.5, etcétera.
TAMAÑO O AMPLITUD DE UN INTERVALO DE CLASE.
El tamaño o la amplitud de un intervalo de clase es la diferencia entre las fronteras de clase inferior y superior y se le conoce como amplitud, tamaño o longitud de clase. Si todos los intervalos de una distribución de frecuencia son de la misma amplitud, a esta amplitud común se le denota por c. En tal caso, c es igual a la diferencia entre dos limites inferiores (o superiores) de clases sucesivas. Para los datos de la tabla 2–1, por ejemplo, la amplitud del intervalo de clase es c = 62.5–59.5=65.5–62.5=3.
MARCA DE CLASE
La marca de clase, que es el punto medio del intervalo de clase, se obtiene promediando los límites inferior y superior de clase. De este modo, la marca de clase del intervalo 60–62 es (60+62)/ 2 = 61. A la marca de clase también se le denomina punto medio de clase.
*REGLAS GENERALES PARA CONSTRUIR DISTRIBUCIONES DE FRECUENCIA.
1. Determinar el número mayor y el menor en los datos sueltos con el fin de especificar el rango (la diferencia entre ambos).
2. Dividir el rango en un número adecuado de intervalo de clase del mismo tamaño. Si esto no es posible, usar intervalos de clase de distintos tamaños o intervalos de clase abiertos. Se suelen tomar entre 5 y 20 intervalos de clase, según los datos. Los intervalos de clase se eligen también de modo tal que las marcas de clase (o puntos medios) coincidan con los datos realmente observados. Ello tiende a disminuir el llamado error de agrupamiento que se produce en análisis matemáticos posteriores. No obstante, las fronteras de clase no debieran coincidir con los datos realmente observados.
3. Determinar el número de observaciones que corresponden a cada intervalo de clase; es decir, hallar las frecuencias de clase.
LIMITES INFERIORES Y SUPERIORES.
Los límites inferiores y superiores son las fronteras de cada categoría, son los valores mínimos y máximo de una distribución.
RANGO
Se denomina rango o rango estadístico al intervalo de menor tamaño que contiene a los datos; es calculado mediante la resta del limite real superior del dato mayor, menos el limite real inferior del dato menor. LRS-LRI.
CLASES:
Subdivisión de escala de datos. Conjunto de categorías obteniendo de manera aproximada de dividir rango entre ancho tamaño del intervalo.
LIMITE REAL INFERIOR
Es la suma del límite inferior con el límite superior de la clase contigua anterior, dividido entre dos.
...