MÉTODO DE APRENDIZAJE PROFUNDO PARA LA CLASIFICACIÓN DE TWEETS CON RIESGO DE COVID-19

VALDÉS CHÁVEZ, ALBERTO (2022) MÉTODO DE APRENDIZAJE PROFUNDO PARA LA CLASIFICACIÓN DE TWEETS CON RIESGO DE COVID-19. Maestría thesis, UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA.

[img]
Vista Previa
Text
Tesis.pdf

Download (4Mb) | Vista Previa

Resumen

Este trabajo de investigación se realizó en Chihuahua, Chih., durante enero 2020 de diciembre de 2021. Durante la pandemia de Covid-19, hubo mucha incertidumbre y falta de información sobre la evolución de la enfermedad. Mediante el análisis de redes sociales es posible extraer información sobre el desarrollo de la pandemia. El objetivo de esta investigación fue el de evaluar dos modelos de Deep Learning para clasificar tweets sobre Covid-19, y diseñar un método novedoso con arquitectura Wide & Deep para la misma tarea. Los modelos y métodos abordaron las tareas 5 y 6 de clasificación dadas por la competencia Social Media Mining For Health (#SMM4H) 2021. Se hizo una comparación de dos modelos basados en Transformers. Uno pre-entrenado sobre temática general y gran tamaño, y otro de temática de Covid-19 de menor tamaño. También se propuso un modelo experimental con arquitectura Wide & Deep. Este modelo combina dos ramas de un modelo alimentadas de diferentes características. La rama profunda utiliza un modelo tipo BERT. La rama ancha utiliza características tipo term frequency-inverse document frequency (TF-IDF), una distribución de tópicos obtenidos por el algoritmo non-negative matrix factorization (NMF) y una métrica que mide que tan personal es una palabra en una oración (EXPEI). El modelo pre-entrenado en temática médica superó por mucho al modelo de temática general. Este modelo entrenado obtuvo el 1er lugar en la competencia para la tarea 6. Mientras que los modelos Wide & Deep obtuvieron mejores resultados que las ramas implementadas de forma individual.

Tipo de Documento: Tesis (Maestría)
Palabras Clave: Aprendizaje máquina, ancho y profundo, Transformadores, BERT.
Clasificación temática: T Technology > T Technology (General)
Usuario Remitente: Admin Repositorio Posgrado
Depositado: 27 Abr 2022 19:12
Ultima Modificación: 27 Abr 2022 19:12
URI: http://repositorio.uach.mx/id/eprint/466

Actions (login required)

Ver Objeto Ver Objeto

Universidad Autonoma de Chihuahua