Actividad: Árboles y random forest para regresión y clasificación
Enviado por peter119 • 21 de Noviembre de 2022 • Apuntes • 260 Palabras (2 Páginas) • 169 Visitas
Asignatura | Datos del alumno | Fecha |
Aprendizaje Automático | Apellidos: Herrera Cobos | 23 – 08 -21 |
Nombre: Pedro Leopoldo |
Actividad: Árboles y random forest para regresión y clasificación
Mediante este laboratorio se pretende que apliques los conocimientos adquiridos en sobre árboles y random forest para un problema de regresión y uno de clasificación: predecir el precio de venta y el rango de precio del inmueble.
Análisis descriptivo de los datos
De las variables numéricas, halla datos estadísticos.
De las variables categóricas, lista las diferentes categorías y halla la frecuencia de cada una de ellas.
Crea matriz de correlaciones existentes entre las variables numéricas del conjunto de datos y analiza los resultados.
- Tratamiento de missing. Si existen valores faltantes, decide si eliminar los registros o llenarlos con valores como la media, la mediana o la moda, y justifica tu respuesta.
- Aplica árboles y random forest al problema de regresión.
- Compara, mediante las medidas que te parezcan adecuadas, la capacidad predictiva de ambos métodos.
- Comenta las ventajas y desventajas de cada modelo. De acuerdo con los resultados, ¿son realmente útiles los modelos creados para el conjunto de datos propuesto?
- Para el ejercicio de clasificación, tanto para árboles como para random forest, se crean los siguientes grupos: grupo 1 (SalePrice menor o igual a 100 000), grupo 2 (SalePrice entre 100 001 y 500 000) y grupo 3 SalePrice (mayor o igual a 500 001).
- Compara los resultados de los dos clasificadores y comenta los resultados.
- Otros comentarios que consideres adecuados.
Extensión y formato
Extensión máxima de la actividad: 15 páginas. Formato: Calibri 12, interlineado 1,5 puntos.
[pic 1][pic 2]
Actividades
...