REGLA DE STURGES
Enviado por yorch_albert • 25 de Febrero de 2014 • 573 Palabras (3 Páginas) • 2.243 Visitas
REGLA DE STURGES:
La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla práctica acerca del número de clases que deben considerar al elaborarse un histograma.
Este número viene dado por la siguiente expresión:
c = 1 + log2 N, donde N es el tamaño de la muestra.
Que puede pasarse a logaritmo base 10 de la siguiente forma:
c = 1 + 3.322 * log N
El valor de “c” (número de clases) es común redondearlo al entero más cercano.
Determinar el número de intervalos de clase: Significa en cuántas categorías o subgrupos vamos a clasificar o agrupar nuestros datos. Para determinar el número óptimo de intervalos de clase, en los cuales nuestros datos quedarán perfectamente distribuidos, aplicamos la Regla de Sturges: Regla de Sturges No. de intervalos de clase = 1 + (3.322*(log n))
En donde “n” representa el número total de datos u observaciones que tenemos recopilados.
Evidentemente, el número de intervalos debe ser exacto; es decir, un número entero.
Demostración:
Considerado un histograma de frecuencias idealizado con k contenedores donde el conteo es el coeficiente binomial.
((k-1)¦i),i=0,1,….,k-1. Como k aumenta, este histograma frecuencia ideal se aproxima a la forma de una densidad normal. El tamaño total de la muestra es:
n=∑_(i=0)^(K-1)▒〖((K-1)¦i)=(1+1)〗K-1 =2K-1
Por la expansión binomial. Por lo que el número de clases para elegir cuando se construye un histograma de datos normal es:
K= 1+ log_2n
Ejemplo:
Tabla de Precipitación pluvial promedio anual en Baja California 1905 a 1994 en pulgadas.
18.6 13.8 10.4 15.0 16.0 22.1 16.2 36.1 11.6 7.8
22.6 17.9 25.3 32.8 16.6 13.6 8.5 23.7 14.2 22.9
17.7 26.3 9.2 24.9 17.9 26.5 26.6 16.5 18.1 24.8
16.6 32.3 14.0 11.6 20.0 33.8 15.8 15.2 24.0 16.4
24.1 23.2 17.3 10.5 15.0 20.2 20.2 17.3 16.6 16.9
22.0 23.9 24.0 22.2 21.8 12.2 22.0 9.6 8.0 20.4
17.2 18.3 13.0 10.6 17.2 8.9 16.8 14.2 15.7 8.0
17.7 16.1 17.8 11.6 10.4 13.6 8.4 12.6 8.1 11.6
21.1 20.5 19.8 24.8 9.7 25.1 31.8 24.9 20.0 17.6
Numero de datos = 90
La selección del número adecuado de clases y los cortes entre ellas es un asunto de criterio y de experiencia. Sin embargo, aquí se dan unas reglas empíricas para calcular el número máximo de clases, (Hoaglin, et. al., (1983) p. 22 y sigs.), una de ellas es la de Sturges (1926) que establece que el número de clases es K = 1 + log2 n = 1 + 3.322 log n, la cual subestima el número de intervalos. Otra es la de Velleman (1976), K = 2√n, recomendada cuando n es pequeño (n £ 50) y otra es la de Dixon y Kronmal (1965), K = 10 log n, para ngrande (n > 50). No se puede establecer que una es superior a otra, sólo pueden utilizarse como un punto de referencia.
...