ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Descripción de la fuente de datos empleada


Enviado por   •  26 de Octubre de 2022  •  Tarea  •  911 Palabras (4 Páginas)  •  64 Visitas

Página 1 de 4

Regresión

Descripción de la fuente de datos empleada

Se presenta una base de datos con información relacionada al volumen de tráfico en una ciudad, con variables como días festivos, condiciones climáticas y fecha. A continuación, se ejecutará el proceso de regresión con Tensorflow y los resultados serán comparados con los modelos no basados en redes neuronales Random Forest y Regresión Lineal. De esta forma se busca predecir la salida de un valor continuo como la cantidad de tráfico automovilístico. Para esto se debe realizar un pre-procesado de información. limpiando valores atípicos y transformando los valores categóricos a nominales.

Caracterización del dataset empleado

El set de datos "Metro Interstate Traffic Volume" fue tomado de UCI en la siguiente URL (https://archive.ics.uci.edu/ml/datasets/Metro+Interstate+Traffic+Volume) y con acceso directo en el repositorio público de GitHub (https://github.com/diegoalvarado-unir/regression/blob/master/Metro_Interstate_Traffic_Volume.csv?raw=true).

Se cuenta con 48204 instancias, 8 variables de entrada y 1 clase de salida.

Como se puede ver en la Ilustración 1, el dataset no tiene registros nulos.

[pic 1]

Ilustración 1Información detallada del dataset para Regresión

Ejecución del modelo de Regresión con Keras, Random Forest Regressor y Linear Regression

Se realiza la limpieza de datos atípicos para temp y rain_1h. Luego se convierten los valores categóricos a numéricos y posterior se normalizan bajo la función Standar Scalar.

El modelo de Keras está constituido por 4 capas ‘Dense’: 1 capa de entrada con 11 neuronas; primera capa oculta de 32 neuronas; segunda capa oculta de 16 neuronas; 1 capa de salida con 1 neurona. Todas bajo la función de activación ReLu. Y en el compilador se tienen métricas MAE y MSE, para verificar el resultado de error al ejecutar el proceso de entrenamiento y predicción.

Al ejecutar el modelo con EarlyStopping, como podemos ver en Ilustración 2, se identifica que tan solo en las 10 primeras épocas ya se obtenia el valor de MAE

[pic 2]

Ilustración 2: MAE vs Epoch

Conclusión

En el presente trabajo se implementó la técnica de Regresión para un problema basado en la cantidad de tráfico automovilístico en una ciudad.

  • Se puede ejecutar el modelo Keras bajo atributos nominales, pero como no se encuentra bajo el mismo rango, su ejecución no es tan acertada y requiere un consumo de manquina mayor. Por esta razón es recomendable realizar una normalización, que en este caso se hizo con Standar Scalar
  • Al analizar la métrica de error absoluto medio (MAE) en los diferentes modelos, podemos inferir que el valor más bajo se encuentra al ejecutar Random Forest Regressor.
  • Se tomo el 80% de datos de entrenamiento en todos los modelos. Para el caso de Keras, se configura una red con solo 2 capas ocultas para evitar el sobreajuste.
  • En Keras, con tan solo 10 epocas, ya se podia determinar el valor medio absoluto de error, aunque de forma inicial se ejecutaron 100 epocas.

Clasificación

Descripción de la fuente de datos empleada

Se presenta una base de datos con información relacionada al estado físico de una persona, con variables como género, edad, altura, peso, histórico familiar de obesidad, consumo frecuente alto de calorías, número de comidas al día, consumo de comidas intermedias a las principales, consumo de agua diario, consumo de alcohol, consumo de cigarrillo.

...

Descargar como (para miembros actualizados) txt (6 Kb) pdf (146 Kb) docx (75 Kb)
Leer 3 páginas más »
Disponible sólo en Clubensayos.com