Intervalos de confianza
Enviado por Miguel Lozano Narvaez • 6 de Octubre de 2015 • Informe • 1.384 Palabras (6 Páginas) • 162 Visitas
Miguel Lozano
José Luis Nieto
Trabajo Final: Intervalos de Confianza, Prueba de Hipotesis y Regresión Lineal Simple
El archivo adjunto (base de datos proyecto), compuesto por mil registros, presenta la información correspondiente a las variables siguientes:
Distancia: Representa la distancia en kms entre el punto donde descarga una planta química y el punto de lectura sobre un río
Contaminación: Representa el porcentaje de contaminación del agua del rio
De acuerdo a la información anterior, ustedes deben realizar lo siguiente
- Seleccionar una muestra aleatoria de 30 observaciones. Indique el proceso utilizado para la selección de la muestra
Se seleccionó una muestra aleatoria de 30 observaciones, la cual contaba con 1000 registros de distancia y de contaminación.
La muestra se obtuvo aleatoriamente, es decir cada uno de los registros tenía la misma probabilidad de ser elegidos (probabilidad = 1 /1000), además de ello un registro no dependía de la elección de otro registro (independencia) con el objetivo de garantizar la representatividad de la muestra.
La muestra aleatoria resulto ser:
NUMEROS ALEATORIOS | DISTANCIA | CONTAMINACIÓN |
541 | 6,1 | 6,5 |
21 | 2,1 | 11 |
121 | 2,9 | 9,5 |
893 | 9 | 6,3 |
522 | 5,9 | 8,1 |
849 | 8,6 | 7,8 |
91 | 2,7 | 8,9 |
141 | 3,1 | 8,9 |
101 | 2,8 | 7,2 |
639 | 6,8 | 7,1 |
239 | 3,7 | 7,5 |
578 | 6,4 | 6,7 |
706 | 7,4 | 4,8 |
185 | 3,4 | 8 |
108 | 2,8 | 9,5 |
354 | 4,8 | 8,6 |
892 | 9 | 5,6 |
588 | 6,4 | 6,5 |
119 | 2,9 | 8 |
489 | 5,7 | 7 |
69 | 2,5 | 8,8 |
928 | 9,3 | 4,2 |
868 | 8,8 | 4,7 |
231 | 3,7 | 8,4 |
589 | 6,5 | 6,6 |
864 | 8,7 | 3,2 |
673 | 7,1 | 6,5 |
937 | 9,4 | 5,3 |
786 | 7,9 | 5,9 |
795 | 8 | 7,5 |
Cada uno de los registros seleccionados se obtuvo gracias a la opción “aleatorio.entre(0,1000)” que considera una distribución uniforme.
- Construir e interpretar un intervalo de confianza de 95% para la media y para la varianza de cada una de las variables
Debido a que se consideró una muestra aleatoria de 30 registros para resolver cada uno de los incisos del taller, se debe emplear la distribución t-student como distribución de referencia en la estimación del intervalo de confianza para la media.
La expresión matemática para el cálculo del intervalo viene dado por:
[pic 1]
[pic 2]
La media y la desviación estándar para la distancia y el porcentaje de contaminación se presentan a continuación:
INDICADOR | DISTANCIA (kms) | CONTAMINACIÓN (%) |
Media | 5,8133 | 7,1533 |
Desviación estándar | 2,4819 | 1,7334 |
El punto crítico asociado a la distribución t-student es: [pic 3]
- Intervalo de Confianza para la Distancia Media
[pic 4]
[pic 5]
Con una confiabilidad del 95%, la distancia promedio desde el punto de donde descarga una planta química y el punto de lectura sobre el río estará entre 4,8866 y 6,7399 kilómetros aproximadamente.
- Intervalo de Confianza para el Porcentaje Promedio de Contaminación
[pic 6]
[pic 7]
Con una confiabilidad del 95% el porcentaje de contaminación del agua del río, se encuentra entre 6,50614% y 7,8%.
- Probar las siguientes hipótesis:
- La distancia promedio desde el punto de descargue y el punto de lectura es mayor de 5 Km
Se debe probar que la distancia promedio es mayor que 5 Km, es decir que la hipótesis nula [pic 8] y alterna [pic 9] vienen dadas por:
[pic 10]
Debido a que el tamaño de muestra no es suficientemente grande, se considera como distribución de referencia, la distribución t-student.
El estadístico de prueba viene dado por:
[pic 11]
Reemplazando se tiene
[pic 12]
Con un nivel de significancia del 5%, el punto crítico asociado a la distribución t-student, viene dado por:
...