Distribucion De Variables
Enviado por estel • 12 de Abril de 2013 • 2.477 Palabras (10 Páginas) • 418 Visitas
DISTRIBUCIONES DE VARIABLES
El principal interés del investigador cuando estudia el comportamiento de una variable es conocer la distribución de esa variable examinando los valores o realizaciones de dicha variable en la colección de objetos bajo estudio (muestra o población). Es decir, describir y entender como varían los valores de característica estudiada en los individuos bajo consideración.
Existen tres formas principales de analizar la distribución de una variable dentro de un colectivo, ya sea un grupo natural, categoría social completa o muestras de estos colectivos, ellas con:
Distribución de frecuencias absolutas, esta formar de distribución con un ejemplo de una situación en la cual no se dispone de categorías naturales para realizar el análisis. Para elaborarla se comienza por elegir un número reducido de categorías en las cuales podamos agrupar las escolaridades.
Distribución de Porcentajes, habitualmente acompaña al anterior consiste en el cálculo de porcentajes, a partir de las frecuencias absolutas distribuidas en intervalos de clase o categorías. Un tema importante que Se debe resolver en los estudios es el de la evaluación de un cierto resultado.
Las frecuencias acumulativas, se presentan en un cuadro que permiten ver el número o porcentajes de casos que quedan en un cierto intervalo de la distribución cuando se le han sumado los casos de los intervalos anteriores.
Una forma específica de distribución se da cuando se utilizan dos o tres variables con dos o más categorías cada una de ellas para comparar, justamente, cómo se distribuyen en las subcategorías que resultan por el cruce de ellas. Un cuadro en el cual las dos variables tienen el mismo número de categorías se denomina un cuadro de n x n. Un cuadro en el cual se han cruzado dos variables con distinto número de categorías se denomina de m x n. La multiplicación da el número de celdas del cuadro.
MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSION Y DE CONCENTRACIÓN.
Las medidas de tendencia son números calculados con fórmulas especiales que representan en forma sumaria a una serie de valores de una variable cuantitativa. Las medidas de desviación por su parte expresan la heterogeneidad u homogeneidad de esos valores. Ambas medidas, son variables colectivas que caracterizan al colectivo en el cual se dan los correspondientes valores individuales.
El modo, es el valor de una seria que se da con mayor frecuencia entre los miembros de un colectivo. Puede ser utilizado con variables nominales ya que basta contar los números de sujetos que hay en cada categoría de una variables de ese tipo, es fácil de determinar y por ello se le emplea como una primera medida de tendencia central.
La medida varía considerablemente de una muestra a otra, tomada del mismo universo. Puede dar una buena representación del colectivo del cual proviene.
La Mediana, es el valor que ocupa el lugar central de una distribución ordenada de valores. Habitualmente en orden ascendente.
La mediana es una medida de tendencia central que está especialmente indicada para datos ordinales, como puntajes obtenidos en la medición de actitudes, calificaciones etc.
El Medio Aritmético, es una de las medidas de tendencia central más utilizada para caracterizar a un colectivo mediante un solo valor. Ese valor es la suma de los valores de una variable cuantitativa continua, de carácter proporcional, dividida por el número de los valores sumados. Se utiliza con datos ordinales.
Varianza y desviación estándar, son medidas de dispersión o de variabilidad de los datos de una serie de valores, indican la semejanza o diferencia que existe entre los individuos de un colectivo con relación a una cierta variable cuantitativa.
Las principales de esas medidas, son las varianza, la desviación estándar y el índice de dispersión, las dos primeras deben utilizarse con variables proporcionales, el índice de dispersión, se aplica a variables ordinales y nominales. La Varianza es el promedio de las desviaciones elevadas al cuadrado de cada uno de los valores de una serie respecto del medio aritmético de ella.
Medidas de concentración de una variable.
Para determinar la concentración que puede tener una variable cuantitativa en un cierto colectivo se utilizan dos medidas principales, una de ellas es el Índice de Gini, que se utiliza para averiguar cuál es el grado de concentración.
El otro es el Quintiles, consiste en dividir el total de la población y con los valores de la variable que determinan esa división se calcula los totales de la variable que queda en cada grupo.
ANÁLISIS DESCRIPTIVO INFERENCIAL
La comparación de valores en dos o más subgrupos de una población total es relativamente fácil, bastaría con comparar directamente los dos valores. El mismo procedimiento se utilizaría si se tratase de proporciones o porcentajes calculados.
La situación cambia cuando la comparación se hace con una muestra probabilística. En tal caso el investigador debe realizar pruebas especiales que permitan pronunciarse sobre la significación estadística que pueda tener la diferencia encontrada entre los valores comparados.
Así si un grupo tiene una media de 24 en una variable y otro grupo una media de 26 en la misma variable debemos preguntarnos si esa diferencia también se da en la población de la cual extrajimos la muestra, o la diferencia podría deberse al error de muestreo al cual están sometidas, probabilísticamente, todas las muestras que se toman de una población o universo.
Para resolver problemas como el anterior se usan de pruebas de significación estadística, que son propias para cada medida que se va a comparar.
La secuencia del cálculo necesaria para su realización se expone a continuación:
1º Formulación de una hipótesis nula y de una hipótesis alternativa. Como lo sugiere su nombre, la hipótesis nula plantea que en la población de la cual se extrajo la muestra no existe diferencia entre los valores de los subgrupos que se desean comparar (proporción, media aritmética). Sin embargo, como el investigador supone que existe una diferencia ( y pudo haberlo expresado así en una de las hipótesis de su estudio), formula una hipótesis alternativa que exprese que existe tal diferencia, que la misma es estadísticamente significativa, y que ella se da en la población de la cual se extrajo la muestra.
2º Elección de una distribución de muestreo.
La mayoría de las medidas estadísticas utilizadas en el análisis de datos cuantitativos tienen distribuciones
...