Los expertos reunidos en el Second Latin American and Caribbean Scientific Data Management Workshop consignaron que no existe un sistema o un estándar universal que permita recabar, documentar y compartir los resultados de los estudios que se llevan a cabo sobre la enfermedad

El COVID-19 pone en evidencia la necesidad de avanzar en la gestión de los datos científicos
04-03-2021
PT EN

Los expertos reunidos en el Second Latin American and Caribbean Scientific Data Management Workshop consignaron que no existe un sistema o un estándar universal que permita recabar, documentar y compartir los resultados de los estudios que se llevan a cabo sobre la enfermedad

El COVID-19 pone en evidencia la necesidad de avanzar en la gestión de los datos científicos

Los expertos reunidos en el Second Latin American and Caribbean Scientific Data Management Workshop consignaron que no existe un sistema o un estándar universal que permita recabar, documentar y compartir los resultados de los estudios que se llevan a cabo sobre la enfermedad

04-03-2021
PT EN

Los expertos reunidos en el Second Latin American and Caribbean Scientific Data Management Workshop consignaron que no existe un sistema o un estándar universal que permita recabar, documentar y compartir los resultados de los estudios que se llevan a cabo sobre la enfermedad

 

Por Elton Alisson  |  Agência FAPESP – La pandemia de COVID-19 puso en evidencia la necesidad de acelerar la implementación de sistemas de distribución compartida de datos científicos a los que puedan acceder fácilmente para su utilización los investigadores desde cualquier parte del mundo, para avanzar en el conocimiento de esta y de futuras emergencias de salud pública.

Si bien los estudios realizados globalmente sobre la enfermedad y sobre el virus que la causa, el SARS-CoV-2, han generado una diversidad de resultados y datos, no existe un sistema o un estándar adoptado universalmente para la recolección, la documentación y la distribución compartida de esta información, consignó Ingrid Dillo, miembro del consejo de la Research Data Alliance (RDA), durante su conferencia dictada el pasado 10 de febrero, el primer día del Second Latin American and Caribbean Scientific Data Management Workshop, que se realizó en forma online.

“La propagación del COVID-19 llevó a una rápida y masiva respuesta de investigación, con una diversidad de resultados que se erige como un desafío a la interoperabilidad”, dijo Ingrid Dillo.

“Durante esta pandemia, hemos afrontado el reto de hacer posible el empleo compartido de datos científicos lo más rápido posible, por una parte, y la exigencia de asegurar la calidad de esos datos, por otra. En tal sentido, es necesario que se equilibre con precisión la velocidad para recabarlos y compartirlos”, sostuvo Dillo.

De acuerdo con la especialista, también faltan acuerdos de distribución de datos y existen diferencias en la infraestructura de los sistemas de información de los países.

Con el fin de ayudar a la comunidad científica global a superar estos desafíos, la RDA creó un grupo de trabajo con más 600 expertos de distintas áreas de todos los continentes. Este grupo se reunió virtualmente durante varias semanas entre abril y junio de 2020, y elaboró una serie de directrices con miras a ayudar a investigadores y administradores de datos a seguir las mejores prácticas para maximizar la eficiencia de su trabajo y desarrollar un modelo que sirva para emergencias futuras. Asimismo, creó recomendaciones tendientes a ayudar a los formuladores de políticas científicas y a las agencias de financiación científica a incentivar el uso compartido de datos de calidad para suministrar respuestas apropiadas a las emergencias sanitarias.

“Las directrices apuntan a desarrollar un sistema de datos compartidos destinado a emergencias de salud pública”, afirmó Dillo.

Este trabajo abarcó cuatro áreas –clínica, epidemiología, ciencias ómicas (genómica, proteómica, metabolómica, etc.) y ciencias sociales– y cuatro temas transversales: participación comunitaria, datos de poblaciones indígenas, consideraciones éticas y legales y software de investigación.

Una de las principales recomendaciones que realizó el grupo de expertos apunta a que los gobiernos, los financiadores de la investigación científica y las instituciones de investigación o de fomento de la ciencia de todo el mundo promuevan la ciencia abierta mediante políticas e inversiones tendientes a agilizar el flujo de datos entre entidades locales y en jurisdicciones internacionales.

Otra recomendación consiste en incentivar la publicación y la liberación anticipada de resultados de datos y los software utilizados para producirlos durante emergencias sanitarias.

“Todas las recomendaciones realizadas por el grupo de trabajo son sumamente importantes en el contexto de la pandemia de COVID-19, pero tienen una relevancia mucho más amplia”, sostuvo Dillo.

“Esperamos que el conjunto de recomendaciones y directrices tenga impacto no solo ahora, durante la pandemia, sino también a lo largo del tiempo, pues son bastante genéricas”, afirmó.

La RDA está evaluando si las directrices y recomendaciones elaboradas por el grupo de trabajo también pueden incorporarse a los principios de gestión de datos de investigación referentes a otras enfermedades infecciosas.

Existen muchos desafíos en la gestión y el uso de datos en el área de la salud. “El primero indica que los datos de salud son individuales, dispersos y gestionados en sistemas distintos, y resulta difícil congregarlos”, sostuvo Maurício Lima Barreto, médico epidemiólogo e investigador de la Fiocruz Bahía (la unidad del estado de Bahía de la Fundación Oswaldo Cruz, el instituto de tecnología sanitaria ligado al Ministerio de Salud de Brasil) y docente de la Universidad Federal de Bahía (UFBA).

Las dificultades enfrentadas en la integración de esos datos no están relacionadas únicamente con cuestiones científicas y de procesamiento, sino que comprenden también aspectos éticos y legales, un tema que adquirió mayor relieve ahora en Brasil con la Ley General de Protección de Datos (LGPD), subrayó Barreto.

El investigador coordina en la Fiocruz Bahía el Centro de Integración de Datos y Conocimientos de la Salud, cuyo objetivo consiste en interconectar decenas de sistemas públicos para integrar datos de salud referentes a 100 millones de brasileños.

Los avances en otras áreas

Además de la salud, la astronomía, las ciencias sociales y la física de altas energías, que posee un mayor historial en la gestión y la distribución datos de las investigaciones, otras áreas, como la de las ciencias agrícolas, de la Terra y ambientales, han venido avanzando en este campo, tal como lo consignaron los participantes en el evento.

También por iniciativa de la RDA se creó en el año 2013 un grupo de trabajo para actuar en todos los temas relacionados con los datos agrícolas y de alimentos. Este grupo está integrado por más de 260 miembros de todos los continentes, que representan a las partes interesadas en la gestión de datos referentes a la investigación e innovación agrícola y de alimentos, incluso en lo concerniente a la producción, la inserción y el consumo de datos.

“Esta iniciativa se transformó en un foro para compartir experiencias y dotar de visibilidad a la investigación y al trabajo de gestión de datos agrícolas y de alimentos, aparte de un espacio para la combinación de ideas relacionadas con la gestión y la interoperabilidad de datos en esa área”, dijo Hilary Hanahoe, secretaria ejecutiva de la RDA.

Uno de los resultados del trabajo del grupo fue la elaboración de 39 sugerencias tendientes a facilitar el empleo de la semántica en datos sobre agricultura y nutrición que fueron adoptados por la Organización de las Naciones Unidas para la Alimentación y la Agricultura (FAO, por sus siglas en inglés).

“El grupo de trabajo actúa junto a grandes iniciativas internacionales públicas y privadas de gestión y datos compartidos agrícolas y referentes a alimentos”, afirmó Hanahoe.

En el área ambiental, un grupo de investigadores de la Escuela Politécnica de la Universidad de São Paulo (Poli-USP), en Brasil, en colaboración con pares de Francia, Estados Unidos, Japón, Australia y el Reino Unido, pretende desarrollar nuevas herramientas para compartir y reutilizar datos referentes a los impactos socioeconómicos de áreas naturales protegidas –o unidades de conservación– en las comunidades locales.

Las herramientas y métricas resultantes del proyecto, apoyado por la FAPESP en el marco de un acuerdo con el Belmont Forum, permitirán prever mejor y mitigar los efectos de las acciones que rompan con las prácticas históricas de uso de la tierra, que amenazan a las comunidades locales. Los resultados serán útiles para los investigadores que manejan datos sobre la tierra, el espacio y el ambiente en todo el mundo, según explicó Pedro Luiz Pizzigatti Correa, docente de la Poli-USP y coordinador del proyecto.

“Combinaremos imágenes satelitales con técnicas de aprendizaje automático profundo para el pronóstico de la pobreza en las regiones analizadas”, dijo Pizzigatti.

En el área de ciencias de la Tierra, un grupo internacional de científicos especializados en teledetección se ha venido dedicando a la gestión y a la distribución de datos sobre nieve, mantos de hielo, glaciares, suelos congelados e interacciones climáticas que constituyen la criósfera del planeta, a través del National Snow and Ice Data Center (NSIDC), de la agencia espacial estadounidense, la Nasa.

Los profesionales y los científicos abocados a la gestión de datos participantes en el proyecto trabajan con proveedores y usuarios de datos con miras a crear o publicar productos, herramientas y recursos, de manera tal de asegurar que los datos científicos pasados, presentes y futuros permanezcan accesibles a todos en forma abierta, con el objetivo de estudiar la Tierra y su clima.

Los datos relacionados con la criósfera que pasan por la curaduría de los investigadores incluyen desde un mínimo archivo de texto hasta terabytes de datos de teledetección generados en el Sistema de Observación de la Tierra de la Nasa.

“En el marco de esta misión, la Nasa lanzó un satélite llamado ICESat-2 en el año 2018, cuyo objetivo es observar fundamentalmente el hielo marítimo y terrestre en el Ártico y en la Antártida”, dijo Steve Tanner, coordinador del NSIDC.

Este satélite posee un instrumento llamado Atlas (las siglas en inglés de Advanced Topographic Laser Altimeter System), que emite constantemente pulsos de rayo láser de luz verde que se rebaten sobre la superficie de la Tierra y regresan al satélite, como un radar de láser. Al medir cuánto tiempo tardan los fotones para regresar al satélite, es posible determinar con precisión la altura no solo los glaciares, sino también de los árboles, y la profundidad de los ríos, por ejemplo.

“Hay muchos datos que genera ese satélite que pueden ser útiles para los países costeros o con muchas vías navegables, tal como es el caso de Brasil, y para obtener datos sobre áreas de agricultura y bosques”, sostuvo Tanner.

El investigador exhortó a los participantes en el workshop a ingresar a las páginas del NSIDC, que cuenta con un grupo de expertos dedicados a ayudar a despejar dudas y también a ayudar a bajar los datos de interés.

El NSIDC es uno de los centros de datos certificados por el World Data Systen (WDS), un organismo interdisciplinario del Consejo Científico Internacional (ISC, por sus siglas en inglés) con la misión de asegurar el acceso universal y equitativo a los datos científicos.

“Fomentamos que se compartan abiertamente y en forma totalmente gratuita los datos científicos almacenados en todos los repositorios de las organizaciones de investigación. Entendemos que existen situaciones en que esto no es posible por motivos éticos o legales, pero en todos los otros casos es necesario que los datos científicos queden disponibles con el mínimo atraso posible”, dijo Alex de Sherbinin, presidente del comité científico del WDS.

Otros preceptos de la entidad apuntan a que los datos científicos compartidos sean auténticos y que tengan alta calidad e integridad. “Esto es particularmente importante en la era de la posverdad, cuando la confianza en los datos debe establecerse fehacientemente”, sostuvo Sherbinin.

Un rol pionero

El workshop, organizado por la FAPESP en el marco de su Programa de Investigaciones en eScience y Data Science, en colaboración con el WDS, la RDA y la Academia Brasileña de Ciencias (ABC), tuvo por objeto debatir las mejores prácticas de gestión de datos en repositorios y las nuevas tendencias y perspectivas para los sistemas de datos científicos. 

La primera edición tuvo lugar en el año 2018 y redundó en la creación en la ABC de un grupo de trabajo abocado a la elaboración de normas y directrices sobre el tratamiento de datos abiertos para el avance de la ciencia y la tecnología en Brasil.

“En agosto de 2020, el grupo emitió un documento sobre los retos inherentes a la gestión de datos científicos en Brasil, y ahora está elaborando un nuevo texto enfocado en la ciencia abierta”, dijo Luiz Davidovich, presidente de la ABC, quien puso de relieve el liderazgo en el área de la moderadora del evento, Claudia Bauzer Medeiros

La investigadora es docente del Instituto de Computación de la Universidad de Campinas (IC-Unicamp), en el estado de São Paulo, y miembro de la ABC, del comité científico del WDS y de la coordinación del Programa FAPESP de Investigaciones en eScience y Data Science.

“La FAPESP fue la primera agencia de financiación de la investigación científica de América del Sul que exigió planes de gestión de datos en todas las remisiones de proyectos. Esto está elevando la concientización de la comunidad académica acerca de la relevancia de los datos compartidos como un hito de las buenas prácticas científicas”, subrayó Luiz Eugênio Mello, director científico de la Fundación.

Puede accederse al evento completo en el siguiente enlace: www.youtube.com/watch?v=AB3BCPr43Ok.  
 

  Republicar
 

Republicar

The Agency FAPESP licenses news via Creative Commons (CC-BY-NC-ND) so that they can be republished free of charge and in a simple way by other digital or printed vehicles. Agência FAPESP must be credited as the source of the content being republished and the name of the reporter (if any) must be attributed. Using the HMTL button below allows compliance with these rules, detailed in Digital Republishing Policy FAPESP.