Estadistica punto 1.1 9 edicion
Enviado por Brayan Duarte Alba • 28 de Febrero de 2021 • Documentos de Investigación • 1.372 Palabras (6 Páginas) • 77 Visitas
TALLER DE APOYO PRIMER CORTE 2021-1
Contexto 1
La aeronáutica de Estados Unidos está interesada en analizar los vuelos que tienen como origen Seattle y Portland. El 6 de febrero de 2014 se registraron 394 vuelos desde los aeropuertos Seattle (SEA) y Portland (PDX) a los diferentes aeropuertos de Estados Unidos.
La siguiente tabla muestra las variables analizadas:
- Realice la clasificación de cada una de las variables con su correspondiente escala de medición.
Variable | Descripción | CLASIFICACIÓN | ESCALA |
arr_delay | Tiempo de retraso | Cuantitativa | Intervalo |
carrier | Tipo de carrocería del avión | Cualitativa | Nominal |
tailnum | Número de matrícula | Cuantitativa | Intervalo |
flight | Número de vuelo | Cuantitativa | Intervalo |
origin | Origen | Cualitativa | Nominal |
dest | Destino | Cualitativa | Nominal |
air_time | Tiempo de vuelo en minutos | Cuantitativa | Razón |
distance | Distancia | Cuantitativa | Intervalo |
hour | Hora de salida | Cuantitativa | Ordinal discreta |
Minute | Minutos de salida | Cuantitativa | Ordinal continúa |
1.2 Teniendo el dataset “vuelos” responda las siguientes preguntas:
- ¿Qué proporción de vuelos salieron desde el aeropuerto de Seattle?
[pic 1]
R/= La proporción que salió desde Seattle fue 64.6%
¿Qué proporción de vuelos llegaron al aeropuerto de los Ángeles california “LAX”?[pic 2][pic 3]
R/= La proporción que salió desde LAX fue 7.6%
- De todos los vuelos con destino Las Vegas “LAS” ¿qué tipo de carrocería tienen los aviones? Realice una representación gráfica.
[pic 4]
- Determine el promedio, la media y la moda de la variable “distancia”.
Estadísticos | ||
Distancia | ||
N | Válido | 393 |
Perdidos | 0 | |
Media | 1188,82 | |
Mediana | 987,00 | |
Moda | 954 |
R/=Observamos que su moda es 954 debido a que es el dato que más se repite, su promedio es 1182.82 y su dato más central es 987.
- Realice un gráfico representativo para la variable “distancia” y comente su forma, tenga en cuenta las medidas calculadas en el punto d.
[pic 5]
- Analice las medidas de forma para la variable distancia y defina si la variable asume distribución normal.
Estadísticos descriptivos | ||||||
N | Media | Asimetría | Curtosis | |||
Estadístico | Estadístico | Estadístico | Desv. Error | Estadístico | Desv. Error | |
Distancia | 393 | 1188,82 | ,782 | ,123 | -,284 | ,246 |
N válido (por lista) | 393 |
R/=Teniendo en cuenta la Curtosis y al ver que es negativa se considera que la variable distancia es platicurtica, y, además, aunque es pequeña si hay tendencia ser asimétrica hacia la derecha.
- Realice un diagrama de caja comparativo de la variable distancia con respecto a los aeropuertos de origen.
[pic 6]
- Diga si la variable distancia tiene valores atípicos, argumente su respuesta.
Valores extremos | ||||
Número del caso | Valor | |||
Distancia | Mayor | 1 | 373 | 2724 |
2 | 114 | 2717 | ||
3 | 116 | 2701 | ||
4 | 308 | 2701 | ||
5 | 147 | 2688 | ||
Menor | 1 | 392 | 106 | |
2 | 191 | 106 | ||
3 | 195 | 116 | ||
4 | 371 | 129 | ||
5 | 329 | 129a | ||
a. Sólo se muestra una lista parcial de casos con el valor 129 en la tabla de extremos inferiores. |
[pic 7]
R/=Teniendo en cuenta el gráfico y la tabla se puede observar que los valores mayores o iguales a 2688 se presenta un valor atípico y los valores menores o iguales a 106 se presentan valores atípicos.
- Calcule la varianza y la desviación estándar para la variable “distancia”.
Estadísticos | ||
Distancia | ||
N | Válido | 393 |
Perdidos | 0 | |
Desv. Desviación | 653,148 | |
Varianza | 426602,580 |
...