Estadística Descriptiva
Enviado por conaripecomuna • 4 de Junio de 2015 • 4.969 Palabras (20 Páginas) • 234 Visitas
CognoSfera
www.ugr.es/local/rruizb/cognosfera
ESTADÍSTICA DESCRIPTIVA DE UNA VARIABLE
M. Jorge Bolaños Carmona©
Departamento de Estadística e I.O.
Facultad de Biblioteconomía y Documentación
Universidad de Granada
1.INTRODUCCION
El concepto de Estadística es muy amplio, y sus aplicaciones directas o indirectas, muy numerosas; resulta difícil, por ello, dar una definición. Sin embargo, la idea más adecuada es considerar que incumbe a la Estadística la recogida, ordenación, resumen y análisis de datos de cualquier tipo sobre colectivos, lo que significa que no tiene sentido pensar en un dato aislado o individual como terreno de trabajo de la Estadística: es necesario, pues, considerar un grupo de elementos (personas, animales, cosas, experimentos, etc.) a los que se refieren los datos que se consideran. Este conjunto puede venir dado de dos formas que condicionan toda clasificación interna de la Estadística, y que son las siguientes:
a) Población, o conjunto de todos los elementos cuyo estudio nos interesa. Si se dispone de datos de una o más variables sobre la población completa, o se puede acceder a ellos, la Estadística tendrá como misión que la recogida sea adecuada, se ordenen, se estructuren y se resuman dichos datos para su mejor comprensión, es decir, que se describan. Ello nos llevará a hablar de Estadística Descriptiva. Por ejemplo, el conjunto de los varones mayores de 65 años y residentes en una provincia sería una población.
b) Muestra, o conjunto de elementos de los que efectivamente se dispone de datos, y que es una parte (a menudo pequeña) de la población. Cuando no se puede acceder a los datos de toda la población, que es lo más frecuente, y se debe trabajar con sólo los de la muestra, a la simple descripción de los datos se añade el interés por valorar hasta qué punto los resultados de la muestra son extrapolables o generalizables a la población; en consecuencia, será necesario utilizar no sólo las técnicas de la Estadística Descriptiva, siempre obligadas en todo caso para la comprensión de los resultados, sino también otras que permiten inferir afirmaciones sobre la población a partir de los datos de la muestra y que constituyen la Estadística Inferencial o Inferencia Estadística. Por ejemplo, el grupo de los varones mayores de 65 años y residentes en una provincia que son usuarios de bibliotecas públicas sería una muestra de la población citada en el párrafo anterior (otra cosa es que la muestra fuese o no representativa del conjunto de tal población).
Los elementos fundamentales de la descripción de una variable son los que siguen en los apartados siguientes, que se pueden resumir de esta forma:
- En primer lugar, se hará hincapié en que lo que se estudia son en realidad las variables, lo que nos obligará a distinguir los tipos básicos de ellas, porque tienen un tratamiento distinto en todo lo que sigue.
- Las distribuciones de frecuencia son necesarias en el paso siguiente para expresar los resultados obtenidos mediante tablas estadísticas.
- Las gráficas estadísticas dan una información similar a la de las tablas, pero de forma más directa; de ellas trata otro apartado.
- Finalmente, el resumen de la información se realiza mediante las medidas de centralización, dispersión y posición.
2. TIPOS DE VARIABLES.
Lo que se estudia en una muestra o población es una serie de variables en cada individuo o elemento. Lo usual es considerar primero las variables una a una, sin plantearse problemas de asociación entre ellas, por lo que podemos pensar sólo en una variable de cuyos datos imaginamos disponer en una muestra (el número de datos es el llamado Tamaño de Muestra, para el que habitualmente se utiliza la letra n). Los tipos de variables, y consecuentemente las clases de datos que se pueden encontrar, son básicamente las siguientes:
A) Variables CUALITATIVAS, también llamadas CARACTERES, VARIABLES CATEGÓRICAS o ATRIBUTOS, que son aquellas que no necesitan números para expresarse; cada forma particular en que pueden presentarse se denomina modalidad. Por ejemplo, el sexo de una persona es una variable cualitativa y “varón” o “mujer” son sus únicas modalidades. En consecuencia, para una variable cualitativa, cada dato no es más que la información de que un determinado elemento de la muestra presenta una determinada modalidad. Entre la variables cualitativas cabe distinguir:
a1) las variables cualitativas ORDINALES, que son las que teniendo más de dos modalidades tienen establecido un orden natural entre las mismas, de forma que sus modalidades se enuncian siguiendo una cierta ordenación ascendente o descendente y no de otra manera. Por ejemplo, la variable “gravedad del pronóstico de lesiones traumáticas” podría tener como orden natural entre sus modalidades “leve”, “moderado”, “grave”, etc., pero nunca diríamos “grave”, “leve”, “moderado”, etc. en este orden.
a2) las variables cualitativas PURAS, que no tienen un orden natural preestablecido entre sus modalidades, y podemos utilizar cualquier ordenación para ellas, como por ejemplo el grupo sanguíneo o la nacionalidad de una persona (no hay que confundirse con ordenaciones arbitrarias, como el orden alfabético, pensando que convierten en ordinales a las variables, ya que no significan una verdadera ordenación natural de las modalidades).
a3) las variables DICOTOMICAS, que tienen sólo dos modalidades posibles, y en las que ni siquiera tiene sentido plantearse si son o no ordinales; El hecho de tener sólo dos modalidades les confiere características especiales. Cabe citar como ejemplos el ya citado del sexo, el pertenecer o no a una asociación, o en general cualquier situación que sólo admita una respuesta “sí o no”.
B) Variables CUANTITATIVAS o NUMERICAS, que son aquellas que necesitan números para ser expresadas, como la edad de alguien o el número de páginas de un libro. Cada forma particular en que se presentan es un valor numérico, y un dato es en estas variables un número que refleja el valor de la variable en un elemento de la muestra. También pueden distinguirse al menos dos subtipos:
b1) las variables cuantitativas DISCRETAS, cuyos valores son aislados (habitualmente números enteros), de forma que pueden enumerarse y existen valores “consecutivos” entre los que no puede haber otro; Por ejemplo, un resumen puede tener 349 ó 350, pero no 349.17 palabras.
b2) las variables cuantitativas CONTINUAS, que pueden tomar cualquier valor
...