Datos de Panel: Los datos de panel son una colección de datos intermedia entre los de corte transversal y los de series de tiempo
Enviado por Álvaro Jiménez Araya • 18 de Marzo de 2017 • Apuntes • 1.210 Palabras (5 Páginas) • 344 Visitas
Datos de Panel: Los datos de panel son una colección de datos intermedia entre los de corte transversal y los de series de tiempo
Por ejemplo se toman muestras de distintas variables de ciertas personas por un periodo de tiempo mas bien corto, por lo tanto cada vez que se toman los datos se obtinen una muestra de corte transversal, pero la suma de estas se convierte en datos de panel, asi mismo cuando ya es por muchos periodos de tiempo se denominan series de tiempo
La distribución de frecuencia es un resumen tabular de datos que muestra el número (frecuencia) de cada una de las distintas clases.
Frecuencia Relativa: se define como la proporción del total que representa cada una de las frecuencias, y viene dada por la formula
Fr = frecuencia/n donde n representa el total de datos
[pic 1]
[pic 2]
DISTRIBUCION DE FRECUENCIA Y REPRESENTACIONES GRAFICAS
La idea de utilizar gráficas responde a mejorar y simplificar el análisis de los datos.
Existen otro tipos de gráficos que también son utilizados como el de Torta. Este último tiene más que ver con representaciones gráficas porcentuales.
FRECUENCIA DE DATOS CUANTITATIVOS
[pic 3]
Como vemos aqui nuestra variable son los dias que demoran en hacer las auditorias de estos distintos clientes, donde la clase no esta bien definida como en el caso cualitativo donde las bebidas compradas eran identificables claramente como clases
Para poder dar solución a esto debemos seguir los siguientes pasos:
i Determinar el numero de clases
ii Determinar el ancho de cada clase
iii Determinar los lImites de clases
El número de clases tiene que ver con que cantidad de datos tenemos, y que tan distintos son entre ellos. Se recomienda que no sean menos de 5 clases, y a su vez no es recomendado usar mas de 20 clases.
En nuestro ejemplo son pocos datos, por lo que con 5 clases bastará
El ancho de clases es determinado segun el numero de clases que hayamos decidido incluir, se calcula como:
Ancho Aprox.= (Valor mayor de datos - Valor menos de datos)/Numero de clases
Es muy probable que el resultado de este valor nos nos entregue un numero entero, por lo que por lo general es apropiado aproximarlo al entero al valor más apropiado.
[pic 4]
[pic 5]
[pic 6]
En el caso de este tipo de datos cantitativos como en nuestro ejemplo, el gráfico que más usualmente se ocupa es el histograma
Este se arma con los datos de frecuencia, frecuencia relativa o frecuencia porcentual
El caracter más importante que entregan los histogramas es proveer información acerca de la distribución
Veremos que es importante en algunos casos notar si la distribución de los datos esta más cargada hacia la derecha, la izquierda o es mas bien simétrica
El gráfico de Tallo y hoja es muy similar al histograma, y no requiere establecer las clases previamente
DESCRIPCIÓN NUMERICA
Hasta ahora ya hemos visto representaciones tabulares y gráficas .Ahora comenzaremos a ver varias medidas numericas que nos ayudaran a interpretar de otra manera los datos
Estas medidas numericas son de localización, disperción, forma y asociación
Este tipo de medidas se llaman Estadísticos Muestrales, cuando son extraídos y calculados sobre una muestra
Mientras que si son calculados de la población los llamaremos Parámetros Poblacionales
La Media Aritmética o Valor Promedio es la medida de localización más importante de una variable.
Nos proporciona una medida de localización central de los datos
Si la media es extraída de una muestra la denotaremos x, mientras que si es de la población se denota con la letra griega μ
Mediana:
[pic 7]
[pic 8]
La Moda dentro de un conjunto de datos es aquel valor que tiene más frecuencia.
Si volvemos a nuestros ejemplos anteriores, en el caso del primer conjunto de 5 notas, la moda seria un 46, ya que es la que mas se repite.
Si a este mismo conjunto de valores se le agregara una sexta nota igual a 54, esta se agregaria a la moda, y este conjunto de valores seria Bimodal, con 46 y 54.
Por otra parte, en el segundo conjunto de datos no hay ni una nota que se repita, son todas distintas, y por lo tanto aquí no existe Moda
...