Módulo Estadística Descriptiva
Enviado por Sebas_R • 10 de Marzo de 2022 • Trabajo • 2.919 Palabras (12 Páginas) • 112 Visitas
Estadística
Introducción
La palabra estadística se deriva de la palabra latina status (estado). Los primeros usos de la estadística implicaron la compilación de datos y gráficas para describir diversos aspectos de un estado o país. En 1662, John Graunt publicó información estadística acerca de nacimientos y decesos. Al trabajo de Graunt siguieron estudios de mortalidad y tasas de enfermedad, tamaño de poblaciones, ingresos y tasas de desempleo. Los hogares, gobiernos y empresas se apoyan mucho en datos estadísticos para guiar sus acciones. Por ejemplo, se compilan cuidadosamente y con regularidad tasas de desempleo, tasas de inflación, índices del consumidor y tasas de nacimiento y defunción, y los dirigentes de las empresas utilizan los datos así obtenidos para tomar decisiones que afectan las contrataciones futuras, los niveles de producción y la expansión hacia nuevos mercados.
La palabra "estadística" suele utilizarse bajo dos significados distintos, a saber:
- Como colección de datos numéricos:
Este es el significado más vulgar de la palabra estadística. Se sobrentiende que dichos datos numéricos han de estar presentados de manera ordenada y sistemática. Una información numérica cualquiera puede no constituir una estadística, para merecer este apelativo, los datos han de constituir un conjunto coherente, establecido de forma sistemática y siguiendo un criterio de ordenación.
- Como ciencia:
En este significado, la Estadística estudia el comportamiento de los fenómenos de masas. Como todas las ciencias, busca las características generales de un colectivo y prescinde de las particulares de cada elemento. Así por ejemplo al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de nacimientos y obtener después la proporción de varones. Es muy frecuente enfrentarnos con fenómenos en los que es muy difícil predecir el resultado; así, no podemos dar una lista, con las personas que van a morir con una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo.
Por tanto, el objetivo de la estadística es hallar las regularidades que se encuentran en los fenómenos de masa.
En tal sentido, la Estadística la podemos definir de una manera sencilla como “el manejo de información de una manera adecuada, de tal forma que se minimicen los riesgos en la toma de decisiones”. Permite planear experimentos, obtener datos y luego organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones con base en esos datos.
La Estadística comprende:
- La Descriptiva: Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico.
- La Probabilistica: deducir las leyes que rigen esos fenómenos,
- La Inferencia: hacer predicciones sobre los mismos, tomar decisiones u obtener conclusiones.
Pasos en un estudio estadístico
- Plantear hipótesis sobre una población (por ejemplo: Los fumadores tienen “más bajas” laborales que los no fumadores)
- Decidir qué datos recoger (Esos datos van a ser recogidos en forma de muestras)
- ¿Qué individuos pertenecerán al estudio? Criterios de exclusión ¿Cómo se eligen? Descartamos los que padecen enfermedades crónicas.
- Los datos que se recogen de la muestra se van a organizar en forma de variables, las variables serán observaciones que se hacen de cada uno de los individuos. (números de baja, tiempo de duración de cada baja.
- Recoger los datos (muestreo). El muestreo es el método estadístico por medio del cual se definen los criterios y técnicas que deben orientar el proceso de recolección u obtención de información. El muestreo es una de las herramientas fundamentales de la estadística. Existen procedimientos no probabilísticas y probabilísticas.
- No probabilísticas: conveniencia, por juicio.
- Probabilísticas: aleatorio simple, estratificado, conglomerados, sistemático.
- Describir (resumir) los datos obtenidos:
- tiempo medio de baja en fumadores y no fumadores (estadísticos).
- Porcentaje de bajas por fumadores y sexo (frecuencias), gráficos, ...
- Realizar una inferencia de la población, intentar hacer conclusiones de los datos obtenidos.
- Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.
- Cuantificar la confianza en la inferencia:
- Nivel de confianza del 95%.
- Significación del contraste: p=2%.
Definiciones
- Población: Es la colección completa de todos los elementos (puntajes, mediciones, personas, etc.) que se van a estudiar. Un censo es la colección de cada elemento de una población.
- La población normalmente es demasiado grande para poder abarcarla.
- Un parámetro es una medición numérica que describe alguna característica de una población. Ejemplo: El promedio del peso de todos los estudiantes del salón.
- Muestra: Es un subconjunto de la población al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones)
- Debe ser “representativa”.
- Está formada por miembros “seleccionados” de la población (individuos, unidades experimentales).
- Un estadístico es una medición numérica que describe alguna característica de una muestra. Ejemplo: El promedio del peso de los 15 estudiantes del salón.
- Variable: Una variable es una característica observable que varía entre los diferentes individuos de una población. Las características de cada individuo es lo que más vamos a resumir en variables.
Tipos de variables
- Cualitativas o Categóricas: Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos).
- Nominales: sus valores no se pueden ordenar (Sexo, Grupo Sanguíneo, Religión, Nacionalidad, estado civil)
- Ordinales: Si sus valores se pueden ordenar (Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor)
- Cuantitativas o numéricas: Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos).
- Discretas: Si toma valores enteros (Número de hijos, Número de carros)
- Continuas: Si entre dos valores, son posibles infinitos valores intermedios (Estatura, presión intraocular, Ingresos mensuales)
Ejercicio: Que tipo de variable son los siguientes enunciados:
- El grupo sanguíneo: {A, B, AB, O} (Es Variable Cualitativa nominal)
- Su nivel de felicidad “declarado”: {Deprimido, Indiferente, Muy Feliz} (Es Variable cualitativa ordinal: se puede establecer un orden lógico)
- Profesión: {Abogado, Médico, Ingeniero} (Es una Variable cualitativa Nominal: no tienen un orden predeterminado)
- El número de hijos: {0, 1, 2, 3, ...} (Es una Variable Cuantitativa Discreta)
- La estatura: {1.62, 1.74, ...} (Es una Variable Cuantitativa Continua)
- Dato: Un dato es el valor de la variable asociada a un elemento de la población o muestra. Este valor puede ser un número, una palabra o un símbolo.
Ejemplo
Un estudiante de estadística está interesado en determinar algo sobre el valor promedio en dólares de los automóviles que pertenecen al cuerpo docente de nuestra universidad.
- Cuál es la población: Es la colección de todos los automóviles que pertenecen a todos los miembros del cuerpo docente de nuestra universidad.
- Cuál es la muestra: Es cualquier subconjunto de esa población. Por ejemplo, los automóviles que pertenecen a los profesores del departamento de matemáticas integran a la muestra.
- Cuál es la variable: Es el “valor en dólares” de cada automóvil individual.
- Cuál es el dato: Es el valor en dólares de un automóvil en particular. El automóvil del Sr. Sánchez, por ejemplo, está valuado en 9400 dólares.
- Cuáles son los datos: Los datos serían el conjunto de valores que corresponden a la muestra obtenida (9400, 8700, 15950…)
- Cuál es el experimento: El experimento serían los métodos que se aplican para seleccionar los automóviles que integran a la muestra y determinar el valor de cada automóvil de la muestra. El experimento podría realizarse preguntando a cada miembro del departamento de matemáticas, o de otras formas.
- Cuál es el parámetro: El parámetro sobre el que se está buscando información es el valor “promedio” de todos los automóviles de la población.
- Cuál es el estadístico: El estadístico que encontrará es el valor “promedio” de todos los automóviles de la muestra.
Codificación y representación de variables
- Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador.
- Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos.
Ejemplo:
- Sexo (Cualitativa: Códigos arbitrarios)
1 = Hombre
2 = Mujer
- Raza (Cualitativa: Códigos arbitrarios)
1 = Blanca
2 = Negra
- Felicidad (Ordinal): Respetar un orden al codificar.
1 = Muy feliz
2 = Poco feliz
3 = Nada feliz
- Región:
1 = Norte
2 = Sur
Sexo | Raza | Región | Felicidad |
Mujer | Blanca | Norte | Muy feliz |
Mujer | Blanca | Norte | Nada feliz |
Hombre | Blanca | Sur | Poco feliz |
Mujer | Blanca | Norte | Nada feliz |
...