DETECCIÓN DE ANOMALÍAS DE TIEMPO DE DATOS DEL AGUA UTILIZANDO UN ENFOQUE DE APRENDIZAJE PROFUNDO.

VALDÉS RABELO, SERGIO ALBERTO (2020) DETECCIÓN DE ANOMALÍAS DE TIEMPO DE DATOS DEL AGUA UTILIZANDO UN ENFOQUE DE APRENDIZAJE PROFUNDO. Maestría thesis, UNIVERSIDAD AUTONOMA DE CHIHUAHUA.

[img]
Vista Previa
Text
Tesis_Sergio 2020.pdf

Download (3506Kb) | Vista Previa

Resumen

Los suministros naturales de agua potable se consumen a un ritmo mucho más rápido de lo que se están recargando naturalmente [1]. Haciendo una búsqueda local, La Junta Municipal de Aguas y Saneamientos (JMAS) de Chihuahua nos provee acceso a dos conjuntos de datos: uno relacionado con el proceso de distribución de agua y otro con quejas de fugas y faltas de agua reportado por usuarios al Centro de Información y Servicios (CIS). El objetivo de esta investigación es detectar y predecir comportamientos anómalos de las instalaciones de la red hidráulica de la JMAS de Chihuahua aplicando algoritmos de aprendizaje máquina (ML por sus siglas en inglés) haciendo uso de los datos proporcionados. Inicialmente se realizó un proceso de obtención, preprocesamiento y visualización de los datos con el apoyo de una herramienta web. Posteriormente, fue necesario el etiquetado de datos por un usuario experto de la JMAS, para esto se desarrolló un módulo de la herramienta web que permite etiquetar las anomalías en las instalaciones de la JMAS. Luego se realizaron un conjunto de experimentos con las técnicas de ML para el proceso de detección y predicción de anomalías. Posteriormente, se realiza un análisis de los datos del sistema CIS con el objetivo de relacionar esta información para que pueda ser utilizada en el proceso de detección y predicción de anomalías. Aunque se logra extraer información relevante de estos datos no se logra relacionar esta información con el proceso de detección de anomalías debido a que hay información específica que no está presente en los metadatos. Dentro de los resultados principales de esta investigación está la presentación de un conjunto de datos vírgenes que son proporcionados a la comunidad de ML para dar continuidad a futuras investigaciones, pues se crearon dos datasets uno con todos los datos de cada instalación de la red hidráulica de Chihuahua y el segundo con los datos de dos instalaciones para las cuales se etiquetaron anomalías durante el período de un año. Los experimentos realizados evidencian que, se puede predecir y detectar las anomalías en tiempo real en las instalaciones de la JMAS, mediante el uso de una LSTM como regresor y un clasificador del tipo DecisionTree usando ventanas de tiempo deslizantes. En el caso de la instalación Pozo Aeropuerto 3 se obtuvo un 98% de accuracy, 95% de precisión, 97% de recall y 95% de f1 score. Para la instalación Tanque Loma Larga se obtuvo 95% de accuracy, 81% de precisión, 70% de recall y 73% de f1 score. Las enfoques y técnicas de mejores resultados, fueron integrados en una herramienta web que es presentada como prototipo funcional para predicción y detección de anomalías en tiempo real. Esta herramienta cuenta con los módulos de visualización de los datos, etiquetado de datos, entrenar modelos de ML para instalaciones con datos etiquetados y un módulo que le permite predecir comportamientos anómalos de las instalaciones de la red hidráulica una vez que se tienen los modelos de ML entrenados.

Tipo de Documento: Tesis (Maestría)
Palabras Clave: Detección de anomalías, series de tiempo, aprendizaje profundo, aprendizaje de máquina, datos del agua.
Clasificación temática: S Agriculture > S Agriculture (General)
Usuario Remitente: Admin Administrador del Respositorio
Depositado: 03 May 2021 19:45
Ultima Modificación: 15 Ago 2022 18:20
URI: http://repositorio.uach.mx/id/eprint/322

Actions (login required)

Ver Objeto Ver Objeto

Universidad Autonoma de Chihuahua