Ensayo Generalidades De La Estadistica
Enviado por nancynayara • 16 de Noviembre de 2012 • 1.675 Palabras (7 Páginas) • 1.226 Visitas
ENSAYO LAS MEDIDAS DESCRIPTIVASY LAS MEDIDAS FUNDAMENTALES DE LA ESTADÍSTICA
Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen la información contenida en ella. El estudio de una variable estadística comienza con la obtención de datos, bien sondeando la población o tomando una muestra. El siguiente paso en el proceso es la ordenación de datos elaborando la tabla correspondiente. Trabajar con una tabla es complejo y tedioso por lo que es más conveniente la introducción de nuevos parámetros que nos permitan resumir la información que contienen esas tablas pues el objetivo que se persigue es la sintetización de la información que nos aportan los datos con la menor pérdida posible.
Vamos a agrupar los parámetros en tres grupos dependiendo de su función. Medidas de centralización; con ellas pretendemos condensar los distintos valores de la variable en uno sólo que los resuma luego vienen las medidas de posición.
Una vez ordenados los datos de menor a mayor será necesario identificar la posición de los valores; esto hace referencia a las medidas de tendencia central o de localización.
Y es donde hablamos de la media la cual es la medida más evidente que podemos calcular para describir un conjunto de observaciones numéricas es su valor medio. La media no es más que la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone . Entre estas medidas de tendencia centra o posición tenemos la mediana, luego viene la moda en estadística, la moda es el valor con una mayor frecuencia en una distribución de datos.
Hablaremos de una distribución bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal. Sus principales propiedades son: Cálculo sencillo, Interpretación muy clara, al depender sólo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el parámetro más utilizado cuando al resumir una población no es posible realizar otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las características más frecuentes de determinado sector social. Esto se conoce informalmente como "retrato robot". Así como tiene sus propiedades que la hacen muy valiosa también tiene sus inconvenientes los cuales son: Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del número de intervalos y de su amplitud. Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor. No siempre se sitúa hacia el centro de la distribución. Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales) .
A manera de resumen podemos decir que las distribuciones de frecuencias. Los métodos gráficos son útiles para obtener una descripción general rápida de las observaciones y datos recolectados para su presentación. Hay limitaciones en el uso de esos métodos pues en caso de no poderse presentar los gráficos, harán falta otras técnicas descriptivas para transmitir una idea de la información contenida en aquellos, y por otro lado es difícil usarlos para hacer inferencia estadística pues en particular el histograma de una muestra no necesariamente va a ser idéntico al de la población, y si lo fuesen sería necesario medir el grado de similitud o diferencia entre ambos histogramas. Estas dificultades descriptivas de los métodos gráficos pueden superarse mediante medidas descriptivas numéricas. Por eso se desea usar los datos de una muestra para calcular un grupo de esas medidas (estadísticos) con el fin de transmitir una adecuada imagen mental de la distribución de frecuencias en cuanto a su ubicación, concentración y variabilidad, y que sean útiles para hacer inferencia estadística respecto a la población.
Podemos decir que las medidas de tendencia central o posición nos indican donde se sitúa un dato dentro de una distribución de datos. Las medidas de dispersión, variabilidad o variación nos indican si esos datos están próximos entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se encuentran los datos. Estas medidas de dispersión nos permiten apreciar la distancia que existe entre los datos a un cierto valor central e identificar la concentración de los mismos en un cierto sector de la distribución, es decir, permiten estimar cuán dispersas están dos o más distribuciones de datos. Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos, siendo la media aritmética el dato central más utilizado. Cuando existe una dispersión pequeña se dice que los datos están dispersos o acumulados cercanamente respecto a un valor central, en este caso el dato central es un valor muy representativo. En el caso que la dispersión sea grande el valor central no es muy confiable. Cuando una distribución de datos tiene poca
...