Cómo sacar intervalos entre cuartiles
Enviado por Luis Felipe Olvera Altamirano • 10 de Noviembre de 2020 • Tarea • 902 Palabras (4 Páginas) • 167 Visitas
Cuartiles
Laboratorio de Estadística 1
Encontrar el intervalo entre cuartiles es tan fácil como hacer una simple regla de tres. Para hacerlo, es más que recomendable realizar una tabla de frecuencias por intervalos de los datos que estamos analizando, que incluya particularmente las frecuencias acumuladas (tanto relativa como absoluta). Consideremos la siguiente tabla:
Intervalo | Frecuencia absoluta | Frecuencia acumulada absoluta | Frecuencia relativa | Frecuencia acumulada relativa |
50-60 | 13 | 13 | 10.74% | 10.74% |
60-70 | 21 | 34 | 17.35% | 28.09% |
70-80 | 43 | 77 | 35.53% | 63.63% |
80-90 | 35 | 112 | 28.92% | 92.56% |
90-100 | 9 | 121 | 7.43% | 100% |
Hay que recordar qué información podemos obtener a partir de la tabla. La última columna, la de frecuencia acumulada relativa, indica qué porcentaje de los datos se encuentran por debajo del límite superior del intervalo. Por ejemplo, de acuerdo con el segundo intervalo, sabemos que el 28.09% del total de los datos tienen un valor menor a 70. Otro ejemplo, el 63.63% de los datos tienen un valor menor a 80 de acuerdo con la información del tercer intervalo.
Una vez entendido lo anterior, debemos comprender qué son los cuartiles. La definición del libro (Wackerly) es “los cuartiles dividen el conjunto de datos en cuatro partes iguales”. Sin embargo, para hacerlo más sencillo, podemos definir a cada cuartil como un número; en particular, un límite superior que nos indica qué porcentaje de los datos se encuentran debaje de ese límite superior. De esta misma manera funcionan los deciles y los percentiles donde los deciles dividen a los datos en 10 partes iguales y los percentiles pueden dividirla en cualquier número de partes.
En particular, los cuartiles dividen a los datos en 4. Existen cuatro cuartiles de los cuales el último es trivial. El primero nos dice el límite superior debajo del cual se encuentra el 25% de los datos. El segundo nos indica el límite superior debajo del cual se encuentra el 50% de los datos. El tercero señala el límite superior debajo del cual se encuentra el 75% de los datos. El último, que lógicamente es el límite superior del último intervalo, es un número que nos asegura que el 100% de los datos se encuentran debajo de ese valor. Generalmente no analizamos el último porque es trivial y no comunica ninguna información nueva.
Ahora sí, ¿Cómo sacamos cada cuartil? Existen dos métodos de los cuales les recomiendo ampliamente siempre usar el primero. A continuación, los explico.
Primer método: utilizar la frecuencia acumulada relativa
La intuición detrás es utilizar distancias relativas. Supongamos que queremos encontrar el primer cuartil con la información de la tabla anterior. Queremos encontrar un número debajo del cuál se encuentre el 25% de los valores del total de los datos. Sabemos que ese número es menor a 70 porque el 28.09% de los datos tiene un valor menor a ese número. De la misma manera, sabemos que el número que buscamos es mayor que 60 porque debajo de él se encuentra 10.74% de los datos. Así pues, sabemos que el número se encuentra en el segundo intervalo.
...