Capitulo 8 Descripción de una Muestra
Enviado por arelicabello • 5 de Marzo de 2018 • Ensayo • 2.346 Palabras (10 Páginas) • 106 Visitas
Capitulo 8
Descripción de una Muestra
8.1 Resúmenes
En Probabilidad hemos considerado hasta ahora el comportamiento de observaciones que cumplen un modelo dado. En Estadística, en cambio, disponemos de conjuntos de observaciones (“muestras”) correspondientes a un experimento considerado aleatorio, y debemos extraer de ellas conclusiones sobre los modelos que podrían cumplir. La distribución muestral (o empírica) correspondiente a una muestra , . . . , , es la distribución discreta concentrada en los puntos ( . . . , ) , dando a cada uno probabilidad 1/. La correspondiente función de distribución empírica es[pic 1][pic 2][pic 3][pic 4][pic 5][pic 6]
(8.1)[pic 7][pic 8][pic 9][pic 10]
o sea, una escalera con salto en cada . En este capítulo se presentan algunos métodos sencillos para describir la información contenida en . Veremos ahora cómo sintetizar características de la muestra en unos pocos números relevantes.[pic 11][pic 12][pic 13]
8.1.1 Media y varianza muestrales
Los resúmenes más fáciles de calcular son la media y varianza de la distribución muestral, que son
. (8.2)[pic 14][pic 15][pic 16]
Se prueba como en (4.22) que
(8.3)[pic 17]
Esta fórmula es más fácil que la anterior si solo se dispone de calculadora; pero puede ser numéricamente poco confiable, aún con una computadora, como puede comprobarse en el ejercicio 8.2, que además muestra una forma de evitar ese peligro.
Ejemplo 8.A: Duración de pilas Los siguientes datos son las duraciones (en horas) de una muestra de pilas eléctricas [16].[pic 18]
El lector puede verificar que la media y varianza muestrales son respectivamente 237 y 121.
La media y varianza maestrales tienen la propiedad de que si se las conoce para dos muestras, también se las puede conocer para su unión (ejercicio 8.3). Pese a estas ventajas, estos dos parámetros pueden ser engañosos si se buscan “valores representativos”, como se vio en el ejemplo de pág. 57.
8.1.2 Diagrama de tallo y hoja
Sean los ordenados (o estadísticos de orden). Los métodos más útiles para analizar una muestra están basados en los , cuyo cálculo requiere obviamente ordenar la muestra. Esto puede ser engorroso si es grande y no se dispone de una computadora. El siguiente método, inventado por J.W. Tukey y llamado diagrama de tallo y hoja (“stem-and-leaf plot”) [9], está basado en la idea de que es más fácil ordenar varios conjuntos pequeños que uno grande. Como es más fácil explicarlo con un ejemplo, lo haremos con los datos del Ejemplo 8.A. El lado izquierdo de la Tabla 8.1 muestra el primer paso. Una rápida mirada a los datos muestra que éstos están entre 210 y 270. Los números de la primera columna (“tallo”) representan a 210,. . . ,260. El primer valor de la muestra es 237, que tiene “tallo” 23 y “hoja” 7, y figura por lo tanto como “7” en la fila del 23. El segundo es 242, que figura como “2” en la fila del 24, etc..[pic 19][pic 20][pic 21][pic 22]
Tabla 8.1: Diagrama de tallo y hoja
[pic 23][pic 24][pic 25][pic 26][pic 27][pic 28]
En cada fila se ordenan las “hojas”. El lado derecho de la tabla muestra el resultado final. La segunda columna indica la cantidad de hojas de cada tallo, y la primera da la suma acumulada. Ahora es fácil hallar cualquier guiándose por la primera columna.[pic 29]
El criterio para elegir el tamaño de los “tallos” es que en cada uno la cantidad de valores permita ordenarlos fácilmente. No es necesario –aunque es conveniente– que los tallos estén igualmente espaciados. Como veremos en la sección 8.2.1, este diagrama brinda no sólo un ordenamiento de los datos, sino una forma de representarlos.
8.1.3 “Cuantiles muéstrales”
Volvemos al objetivo de describir la muestra. Como se definió en la sección 4.5.1, el cuantil de α F* es cualquier numero xα tal que F* (t) ≤ Xα si t < Xα, y F* (t) ≥ α si t > Xα.
Como F* es una escalera, los cuantiles no quedan así unívocamente definidos. Para que Xα quede bien definido, y sea además una función creciente y continua de α, se introduce una pequeña modificación, definiendo
X*α = (1-h) para α € [ 1/2n , 1-1/2n], (8.4)[pic 30]
...