En un artículo publicado por un grupo de investigadores de la Universidad de São Paulo, en Brasil, se describe la construcción de la base de datos y el modelado con los primeros resultados de este trabajo (foto: Freepik)
En un artículo publicado por un grupo de investigadores de la Universidad de São Paulo, en Brasil, se describe la construcción de la base de datos y el modelado con los primeros resultados de este trabajo
En un artículo publicado por un grupo de investigadores de la Universidad de São Paulo, en Brasil, se describe la construcción de la base de datos y el modelado con los primeros resultados de este trabajo
En un artículo publicado por un grupo de investigadores de la Universidad de São Paulo, en Brasil, se describe la construcción de la base de datos y el modelado con los primeros resultados de este trabajo (foto: Freepik)
Por Luciana Constantino | Agência FAPESP – Científicos de la Universidad de São Paulo (USP), en Brasil, están empleando inteligencia artificial y una de las mayores plataformas del mundo, Twitter, para intentar crear modelos de predicción de la ansiedad y la depresión que, en el futuro, podrán suministrar señales indicativas de esos trastornos antes de la formulación del diagnóstico clínico.
La construcción de la base de datos, llamada SetembroBR, constituyó un primer paso y aparece descrita en un artículo publicado en la revista científica Language Resources and Evaluation. Su nombre es en honor al movimiento Setembro Amarelo [septiembre amarillo, en portugués] –una campaña de prevención del suicidio que se realiza anualmente– y también debido al hecho de que la recolección de datos se puso en marcha durante un mes de septiembre.
Durante la segunda etapa del trabajo, aún en desarrollo, los científicos lograron algunos resultados preliminares. Entre ellos el que apunta que es posible detectar si una persona está sujeta a un mayor riesgo de desarrollar una depresión únicamente con base en su red social de amigos y seguidores, es decir, sin tener en cuenta las publicaciones del propio individuo.
La base que el grupo creó comprende información relacionada con textos (en portugués) y con la red de conexiones de 3.900 usuarios de Twitter que luego del estudio informaron acerca del diagnóstico o el tratamiento de trastornos mentales. El corpus (o la compilación de información sobre determinado tema) incluye todos los tuits públicos escritos por esos usuarios individualmente −sin retuits–, totalizando alrededor de 47 millones de esos pequeños textos.
“Inicialmente concretamos un compilado en las líneas del tiempo en un trabajo artesanal, analizando textos de alrededor de 19 mil usuarios de Twitter, lo que corresponde casi a la población de una pequeña ciudad. Y luego empleamos dos conjuntos, una parte de usuarios realmente diagnosticados con trastornos mentales y otra aleatoria, que hizo las veces de control. Pretendíamos diferenciar entre personas con depresión y la población en general”, explica Ivandre Paraboni, docente de la Escuela de Artes, Ciencias y Humanidades (EACH-USP) y autor corresponsal del artículo.
Aparte de los textos de los usuarios, la investigación reunió textos de sus redes de amigos y seguidores. Sucede que es común que una persona que tenga algún tipo de trastorno mental siga determinadas cuentas, tales como foros de discusión o a alguna celebridad que asume públicamente que padece depresión. “Esas personas se atraen porque poseen intereses comunes”, añade Paraboni, quien es investigador asociado del Centro de Inteligencia Artificial (C4AI), un Centro de Investigaciones en Ingeniería (CPE) constituido por la FAPESP e IBM Brasil en la USP.
La Fundación también apoya este estudio en el marco del proyecto intitulado “Análisis del lenguaje en redes sociales para la detección precoz de trastornos de salud mental”, encabezado por Paraboni.
Los trastornos de salud mental, entre ellos la depresión y la ansiedad, han venido siendo apuntados por la Organización Mundial de la Salud (OMS) como una preocupación en aumento en el mundo. Estimaciones de dicha entidad indican que aproximadamente un 3,8 % de la población –o 280 millones de personas– se encuentra afectado por la depresión, de acuerdo con datos de 2021.
Con la pandemia de COVID-19, período en el cual los investigadores recabaron los textos de Twitter, hubo un aumento del 25 % en la prevalencia global de la ansiedad y la depresión.
En Brasil, un estudio reciente del Ministerio de Salud con 784 mil participantes reveló que un 11,3 % ya había tenido diagnóstico de depresión, en su mayoría mujeres.
Investigaciones anteriores mostraron que los trastornos mentales a menudo se reflejan en el lenguaje que emplean las personas que padecen esas condiciones, lo que llevó a la realización de una cantidad considerable de trabajos mediante procesamiento de lenguaje natural (PLN) con enfoque en la depresión, la ansiedad y el trastorno bipolar, entre otros diagnósticos. Pero los mismos son en mayor medida en inglés, lo que no siempre refleja el perfil brasileño.
Los modelos
Para realizar el estudio, el grupo de la USP sometió el corpus textual a procedimientos de procesamiento previo y limpieza de datos para remover etiquetas, URL, emoticones y caracteres fuera de estándar, pero manteniendo la escritura original.
Se utilizaron métodos de aprendizaje profundo (del inglés deep learning) para crear cuatro clasificadores de texto y embeddings de palabras individualizadas o dependientes de contextos empleando modelos basados en transformers tipo BERT (un algoritmo de aprendizaje profundo). Estos modelos corresponden a una red neural que aprende el contexto y el significado mediante el monitoreo de relaciones en datos secuenciales, tales como las palabras en una frase.
Como entrada se utilizó una muestra de 200 tuits de cada usuario seleccionados aleatoriamente. Los parámetros se definen ejecutando cinco veces la validación cruzada de los datos de entrenamiento y calculando los resultados promedio.
La investigación detectó que los modelos de transformers tipo BERT fueron los que obtuvieron el mejor desempeño en las tareas de pronóstico de depresión y trastorno de ansiedad. La diferencia entre este y la segunda alternativa, LogReg, fue significativa estadísticamente.
Como los modelos analizan secuencias de palabras o frases enteras, se observó que las personas con depresión, por ejemplo, tienden a hablar de temas relacionados con ellos mismos, con expresiones y verbos en primera persona, y temas tales como muerte, crisis y psicólogos.
“Las señales indicativas de depresión que aparecen en el consultorio no son necesariamente las mismas que están en las redes sociales. Notamos de manera bien acentuada el uso en la red de pronombres en primera persona, tales como “yo” y “mi”, por ejemplo, lo que en psicología constituye una señal indicativa clásica de depresión. Pero también constatamos una alta incidencia entre los usuarios depresivos de la utilización del ícono del corazoncito, el emoji de la afectividad, que quizá aún no esté caracterizado en la psicología”, afirma Paraboni.
El profesor hace hincapié en que los textos se recolectaron totalmente anonimizados. “No difundimos ningún tuit ni tampoco los nombres de los usuarios. Tenemos ese cuidado para que ni los propios alumnos participantes en el proyecto tengan acceso a los datos de los usuarios, para proteger la identidad de las personas”, dice.
Ahora, aparte de ampliar la base de datos, los investigadores trabajan con miras a refinar la técnica computacional aplicada y perfeccionar los modelos iniciales, para que en el futuro quizá pueda aplicarse una herramienta en la práctica. La misma podría ayudar tanto en una eventual selección inicial de personas con señales indicativas de trastornos como ayudar a los padres, familiares y amigos de jóvenes con riesgo de depresión y ansiedad.
Brasil ocupa el tercer lugar en consumo de redes sociales en el mundo, de acuerdo con un estudio dado a conocer a comienzos del mes de marzo por la empresa Comscore, detrás de la India e Indonesia y al frente de Estados Unidos, México y Argentina.
Son 131,5 millones de usuarios conectados en el país durante 46 horas por mes en promedio, lo que representa casi dos días enteros. Las redes a las cuales más entran los brasileños son YouTube, Facebook, Instagram, TikTok, Kwai y Twitter, que recientemente alteró sus reglas, aparte empezar a cobrar por algunos tipos de servicios.
Puede leerse el artículo intitulado SetembroBR: a social media corpus for depression and anxiety disorder prediction en el siguiente enlace: link.springer.com/article/10.1007/s10579-022-09633-0.
Imagen de Freepik
The Agency FAPESP licenses news via Creative Commons (CC-BY-NC-ND) so that they can be republished free of charge and in a simple way by other digital or printed vehicles. Agência FAPESP must be credited as the source of the content being republished and the name of the reporter (if any) must be attributed. Using the HMTL button below allows compliance with these rules, detailed in Digital Republishing Policy FAPESP.