Los participantes en la Escuela São Paulo de Ciencia Avanzada sobre Aprendizaje de Datos advirtieron que las minorías, al tener menos acceso a los servicios que generan datos, tienden a quedar subrepresentadas en los bancos de información que sirven de base para proyectos de aprendizaje de máquinas (foto: Sérgio Andrade)

La matemática al servicio del aumento de la representatividad en el uso del big data
29-08-2019
PT EN

Los participantes en la Escuela São Paulo de Ciencia Avanzada sobre Aprendizaje de Datos advirtieron que las minorías, al tener menor acceso a los servicios de generación de datos, tienden a quedar subrepresentadas en los bancos de información de proyectos de aprendizaje de máquinas

La matemática al servicio del aumento de la representatividad en el uso del big data

Los participantes en la Escuela São Paulo de Ciencia Avanzada sobre Aprendizaje de Datos advirtieron que las minorías, al tener menor acceso a los servicios de generación de datos, tienden a quedar subrepresentadas en los bancos de información de proyectos de aprendizaje de máquinas

29-08-2019
PT EN

Los participantes en la Escuela São Paulo de Ciencia Avanzada sobre Aprendizaje de Datos advirtieron que las minorías, al tener menos acceso a los servicios que generan datos, tienden a quedar subrepresentadas en los bancos de información que sirven de base para proyectos de aprendizaje de máquinas (foto: Sérgio Andrade)

 

Por Maria Fernanda Ziegler  |  Agência FAPESP – La llamada revolución de los datos ha hecho posibles muchos avances. Conceptos de las ciencias de datos, tales como el big data o inteligencia de datos, el aprendizaje de máquinas y la inteligencia artificial, se han vuelto triviales y, en la práctica, han permitido el surgimiento de innumerables soluciones tecnológicas, capaces de dar apoyo a la toma de decisiones. La matemática ha despuntado entonces como una herramienta tendiente a sortear los puntos ciegos existentes en ese proceso, minimizando prejuicios y análisis estadísticos sesgados.

Este tema fue objeto de un debate a cargo de especialistas durante la mesa redonda de apertura de la Escuela São Paulo de Ciencia Avanzada sobre Aprendizaje de Datos, realizada entre los días 29 de julio y 9 de agosto en el Centro de Difusión Internacional de la Universidad de São Paulo (CDI-USP). Este evento contó con el apoyo de la FAPESP y con la organización del Instituto de Matemática y Estadística (IME-USP) de la referida universidad paulista.

“La matemática genera insumos rigurosos y deja todo más claro. Hoy en día cualquiera puede generar, hospedar y consumir datos. El mundo está cambiando mucho en lo que concierne a la forma de generar datos. Así y todo, las minorías tienden a quedar afuera de esos datos generados. En Estados Unidos, podemos notar eso en los hospitales, por ejemplo”, declaró Ling Liu, docente del Georgia Institute of Technology (GeorgiaTech) de Estados Unidos, a Agência FAPESP.

De acuerdo con Liu, como algunas poblaciones no tienen acceso a los servicios, dejan de ser representadas en los datos que sirven de base para la elaboración de proyectos de aprendizaje de máquina para diagnósticos, por ejemplo. “No es adrede, pero existe un prejuicio. Como el modelo diagnóstico no les sirve a esas personas, estas se convierten en algo raro”, dijo.

Para Liu, la combinación de la matemática y la ciencia de datos puede animar a la sociedad, a los jóvenes y a los profesionales con miras alterar esta nueva realidad. “Con la matemática y las herramientas de la ciencia de datos es posible hacer que los datos se conviertan en productos científicos. Con la ciencia de datos podemos aprender a pensar de manera más crítica y no únicamente a buscar fenómenos estadísticos”, dijo.

En este contexto, los científicos de datos deben estar conscientes que los sesgos en la generación de datos producen estadísticas y productos equivocados. “Es más o menos como en el mundo físico: los gobiernos y las empresas fuerzan la mayor participación de las mujeres y de otras minorías para lograr una mayor diversidad en sus acciones y así evitar prejuicios. Lo propio sucede digitalmente con los datos. Con las herramientas matemáticas, es necesario ver qué datos son esos, de donde vienen y si están sesgados”, dijo Liu.

André Carvalho, investigador del Instituto de Ciencias Matemáticas y Computación (ICMC) de la USP, coincide. “La ciencia de datos requiere mucho más de ciencia que de datos, y el uso de esta ciencia se plasma a través de la matemática”, dijo.

La Escuela São Paulo de Ciencia Avanzada sobre Aprendizaje de Datos congregó a un total de 150 investigadores de 19 países, seleccionados entre 642 inscritos para esta capacitación. El programa contó con 11 minicursos y cinco conferencias que contemplaron los principales aspectos del aprendizaje basado en datos.

“El principal objetivo consiste en presentar una perspectiva integrada de las cuatro áreas de la ciencia de la computación –banco de datos, aprendizaje computacional, computación de alto rendimiento y procesamiento de imágenes–, todas ellas con la matemática como base”, dijo el coordinador del comité organizador de la Escuela, João Eduardo Ferreira, quien también afirma que esta perspectiva integrada de las cuatro áreas será fundamental para superar los desafíos que impone la nueva era de los sistemas computacionales.

Dada la transversalidad de la ciencia de datos, la Escuela abarca también otras áreas del conocimiento relacionadas con aplicaciones de técnicas de la ciencia de datos a problemas de la astronomía, la economía, la genética, el procesamiento de imágenes y la gestión de datos.

Teoría y práctica

También al respecto de los impactos sociales que la revolución y la evolución de los datos pueden generar, Yaser Said Abu-Mostafa, docente del California Institute of Technology Caltech y autor del libro Learning from data –que sirvió de inspiración para el nombre de la escuela–, afirmó que la ciencia de datos está inmersa en un contexto distinto al de otras áreas del conocimiento.

“En muchos campos del conocimiento, el reclamo común indica que existe una amplia teoría establecida, pero se tarda mucho para poner algo en práctica. En las ciencias de datos ocurre lo contrario. Lo que tenemos ahora son grandes logros prácticos en campos clásicos, tales como la fusión computacional, el procesamiento de lenguaje natural y el reconocimiento de habla. Estos campos cuentan con un historial de años de dedicación y de métodos aplicados a ellos, y ahora se han convertido en negocios”, dijo.

Para Abu-Mostafa, este escenario genera muchos desafíos. “La matemática no es un lujo. Es nuestra manera de entender como son las cosas para ser capaces de progresar y hacer aún más”, dijo.

Para el científico, uno de los principales factores relacionados con el impacto social de la ciencia de datos reside en la constante del tiempo. “El problema es que un gran cambio no tarda ahora ni siquiera una década para concretarse. Por ende, la turbulencia en el ámbito social es mucho más significativa. Piénsese por ejemplo en los coches autónomos y en la cantidad de choferes profesionales existente en el mundo. En unos cinco años esos coches formarán parte de nuestras rutinas. Y no estoy refiriéndome únicamente a la gran cuestión de los puestos de trabajo, sino también a la interacción humana. Todos tienen un mejor amigo, que es el propio teléfono celular”, dijo.

Las aplicaciones en diversas áreas del conocimiento

Desde 2010, la FAPESP ha brindado apoyo a 76 eventos internacionales en la modalidad Escuela São Paulo de Ciencia Avanzada, cuyo objetivo consiste en atraer a jóvenes científicos a São Paulo y aportar a la creación de un ambiente internacionalizado en las universidades.

El presidente de la FAPESP, Marco Antônio Zago, quien se hizo presente en la apertura de la Escuela São Paulo de Ciencia Avanzada sobre Aprendizaje de Datos, remarcó importancia del tema abordado.

“La ciencia de datos es una forma racional de recabar, clasificar y ordenar la información que se genera en cantidades cada vez mayores, merced al avance técnico. Y es más que ello: es una oportunidad de explorar la integración de distintas áreas y crear medios para extraer conocimiento de la información”, dijo.

El rector de la USP, Vahan Agopyan, afirmó en la ocasión que la ciencia de datos es uno de los temas estratégicos de la investigación científica. “Es una satisfacción ser la sede de una escuela que discute y promueve estas ideas”, dijo.

También presente en la apertura de la Escuela, la secretaria de Desarrollo Económico del Estado de São Paulo, Patricia Ellen da Silva, hizo hincapié en el compromiso con la FAPESP y con las universidades públicas del estado en la inversión en ciencia y tecnología para el propio desarrollo del estado.

“Creemos que solo con base en este tipo de inversiones podemos crecer económica y socialmente, y también erigirnos en actores globales de la innovación. Todas estas tecnologías, que hacen posible una nueva revolución en áreas tan distintas como las de salud y ciudades inteligentes, están interconectadas, y la ciencia de datos se vuelve cada vez más importante para nosotros”, dijo.

Roberto Marcondes Cesar Junior y Claudia Maria Bauzer Medeiros, miembros de la coordinación del Programa FAPESP de Investigación en eScience y Data Science, también estuvieron presentes en la apertura del evento. Más información en: sites.usp.br/datascience/spsas-learning-from-data.  

 

  Republicar
 

Republicar

The Agency FAPESP licenses news via Creative Commons (CC-BY-NC-ND) so that they can be republished free of charge and in a simple way by other digital or printed vehicles. Agência FAPESP must be credited as the source of the content being republished and the name of the reporter (if any) must be attributed. Using the HMTL button below allows compliance with these rules, detailed in Digital Republishing Policy FAPESP.