Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023
Fecha
2024Metadatos
Mostrar el registro completo del ítemResumen
En años recientes, la ausencia de sistemas automatizados en la predicción de la
calidad del agua ha ocasionado retrasos significativos en la obtención de datos
precisos, lo cual ha impactado la fiabilidad de los cálculos y ha elevado los costos
asociados a todo el proceso. La investigación está enfocada en desarrollar modelos
de aprendizaje automático para automatizar el sistema para predecir calidad del
agua en la cuenca de Azángaro. Los datos se consultaron de la base de datos que
cuenta la institución nacional SNIRH de Perú dentro de la temática calidad del agua,
obteniendo un total de 136 muestras, donde la metodología empleada para el
desarrollo del modelo fue, recolección de datos históricos, selección de parámetros,
procesamiento y limpieza de datos, división de datos (prueba - entrenamiento),
entrenamiento del modelo y finalmente la etapa de validación de cada modelo, en
este punto es donde se evaluó el rendimiento de que tan bien puede predecir cada
modelo la calidad del agua. Los resultados fueron, de los 5 modelos de predicción
desarrollados, Random Forest (RF) seguido de Decisión Trees (DTs) lograron un
buen rendimiento en métricas de evaluación, en el modelo Random Forest se
obtuvo un Root Mean Squared Error (RMSE) de 3.354, Mean Squared Error (MSE)
de 12.886, un Mean Absolute Error (MAE) de 2.563 y Coefficient of Determination
(R2) de 0.613. Por ende, se concluye que el desarrollo de este modelo presenta un
desempeño óptimo para la predicción de la calidad del agua.
Colecciones
- Lima Norte [1447]