Estadistica Descriptiva
Enviado por yarjac • 7 de Junio de 2014 • 3.170 Palabras (13 Páginas) • 346 Visitas
Estadística Descriptiva o Deductiva
Es un proceso mediante el cual se recopila, organiza, presenta, analiza e interpreta datos de manera tal que describa fácil y rápidamente las características esenciales de dichos datos mediante el empleo de métodos gráficos, tabulares o numéricos, así por ejemplo:
Supóngase que un docente de Matemática calcula la calificación promedio de uno de sus cursos a su cargo. Como solo se está describiendo el desempeño del curso pero no hace ninguna generalización acerca de los diferentes cursos, en este caso el maestro está haciendo uso de la Estadística Descriptiva.
POBLACIÓN
Llamado también universo o colectivo es el conjunto de todos los elementos que tienen una característica común.
Una población puede ser finita o infinita. Es población finita cuando está delimitada y conocemos el número que la integran, así por ejemplo: Estudiantes de la Universidad UTN. Es población infinita cuando a pesar de estar delimitada en el espacio, no se conoce el número de elementos que la integran, así por ejemplo: Todos los profesionales universitarios que están ejerciendo su carrera.
MUESTRA
Es un subconjunto de la población. Ejemplo: Estudiantes de 2do Semestre de la Universidad UTN. Sus principales características son:
Representativa.- Se refiere a que todos y cada uno de los elementos de la población tengan la misma oportunidad de ser tomados en cuenta para formar dicha muestra.
Adecuada y válida.- Se refiere a que la muestra debe ser obtenida de tal manera que permita establecer un mínimo de error posible respecto de la población.
Para que una muestra sea fiable, es necesario que su tamaño sea obtenido mediante procesos matemáticos que eliminen la incidencia del error.
Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula:
Donde:
n = el tamaño de la muestra. N = tamaño de la población.
Desviación estándar de la población que, generalmente cuando no se tiene su valor, suele utilizarse un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en relación al 99% de confianza equivale 2,58, valor que queda a criterio del encuestador.
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.
Ejemplo ilustrativo: Calcular el tamaño de la muestra de una población de 1000 elementos.
Solución:
Se tiene N=1000, y como no se tiene los demás valores se tomará o=0,5 , Z = 1,96 y e = 0,05. Reemplazando valores en la fórmula se obtiene:
VARIABLE
Son caracteres susceptibles a cambio y pueden tener diferentes valores en cada elemento o individuo.
Clasificación
- Variable Cualitativa
Son atributos que se expresan mediante palabras no numéricas. Como por ejemplo, profesión, religión, marca de automóvil, estado civil, sexo, raza, etc.
- Variable Cuantitativa
Es toda magnitud representada por números. Como por ejemplo, peso, estatura, número de habitantes, etc.
- Variable Discreta
Es una característica cuantitativa representada por números enteros o exactos, que generalmente resultan del proceso de conteo, como por ejemplo: número de estudiantes de la promoción del año anterior.
- Variable Continua
Es una característica cuantitativa que puede tomar cualquier valor representado por un número racional, que generalmente resultan del proceso de medición, como por ejemplo, tiempo destinado a estudiar Estadística
Niveles de medición
- Nivel Nominal
Cuando los datos sólo pueden contarse y clasificados en categorías, no existe un orden específico entre las clases. Como por ejemplo, se cuentan cuántos hombres y cuántas mujeres asisten a determinado evento.
- Nivel Ordinal
Cuando se ordenan los datos por jerarquías, una categoría es mayor que otra. Como por ejemplo, excelente es mejor que bueno o bueno es mejor que regular. Otro ejemplo: Una persona puede tener mucho o poco dinero.
- Nivel de Intervalos
Cuando se incluye todas las características del nivel ordinal, pero la diferencia entre los valores tiene un significado medido en unidades iguales que son comunes y constantes, que permiten asignar números reales a todos los miembros de la clase ordenada, facilitando el establecimiento de diferencias en grados de propiedad y entre objetos sobre la base de una medida. Como por ejemplo: La diferencia entre 70 kilogramos y 60 kilogramos, es de 10 kilogramos. Otro ejemplo: Si la temperatura de hoy es de 20 grados centígrados y la de ayer fue de 25 grados centígrados, se sabe que la de hoy es 5 grados centígrados más baja que la de ayer.
- Nivel de Razón o Cociente
Este es el nivel de medición "más alto", tiene todas las características del nivel de intervalos y además en este nivel de medición el cero tiene significado (así si se tiene 0 dólares, entonces no se poseen fondos), y la razón (o cociente) entre dos números también es significativa (Un estudiante obtiene una calificación de 3/10 y otro 6/10, el segundo estudiante obtiene el doble que el primero).
Distribuciones de frecuencia
Cuando se dispone de gran número de datos, es útil el distribuirlos en clases o categorías y determinar el número de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenación tabular de los datos en clases, reunidas las clases y con as frecuencias correspondientes a cada una, se conoce como una distribución de frecuencias o tabla de frecuencias. La Tabla 1 es una distribución de frecuencias de alturas (registradas con aproximación de pulgada) de 100 estudiantes de la Universidad XYZ.
La primera clase o categoría, por ejemplo, comprende las alturas de 60 a 62 pulgadas y viene indicada por el símbolo 60 - 62. Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5.
Los datos ordenados y resumidos como en la distribución de frecuencia anterior, se suelen llamar datos agrupados. Aunque con el proceso de agrupamiento generalmente se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos «todos» en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos, puestas así de manifiesto.
Intervalos de clase y límites de clase
Un símbolo que define una clase, tal como
...