Repositório de acesso aberto voltado a subsidiar pesquisas sobre a doença reúne informações anonimizadas e exames clínicos e laboratoriais de 485 mil pacientes atendidos por cinco instituições
Repositório de acesso aberto voltado a subsidiar pesquisas sobre a doença reúne informações anonimizadas e exames clínicos e laboratoriais de 485 mil pacientes atendidos por cinco instituições
Repositório de acesso aberto voltado a subsidiar pesquisas sobre a doença reúne informações anonimizadas e exames clínicos e laboratoriais de 485 mil pacientes atendidos por cinco instituições
Repositório de acesso aberto voltado a subsidiar pesquisas sobre a doença reúne informações anonimizadas e exames clínicos e laboratoriais de 485 mil pacientes atendidos por cinco instituições
Elton Alisson | Agência FAPESP – O COVID-19 Data Sharing/BR disponibilizou uma nova carga de dados, depositados por instituições participantes do primeiro repositório de acesso aberto do país com informações demográficas e de exames clínicos e laboratoriais anonimizados de pacientes que fizeram algum exame relacionado à COVID-19.
A plataforma lançada em junho de 2020 por iniciativa da FAPESP em parceria com a Universidade de São Paulo (USP) com o objetivo de subsidiar pesquisas científicas sobre a doença reúne, agora, dados anonimizados de 485 mil pacientes, aproximadamente 47 mil registros de desfecho e mais de 23 milhões de registros de exames clínicos e laboratoriais.
Os dados abrangem o período de novembro de 2019 a dezembro de 2020. Ainda que o primeiro caso da doença no Brasil tenha sido registrado em fevereiro de 2020, pelo Hospital Albert Einstein, o período de cobertura dos dados permite aos pesquisadores analisarem o histórico de saúde, bem como buscar evidências de sintomas da COVID-19 em pacientes atendidos anteriormente.
“Não se trata apenas de um aumento no volume de dados, o que seria esperado porque o período coberto é maior. Agora também há no repositório dados de mais duas instituições, o que permite ampliar o universo de estudos”, avalia Claudia Bauzer Medeiros, professora do Instituto de Computação da Universidade Estadual de Campinas (Unicamp) e participante do projeto.
“Há maior diversidade de dados de desfecho, por exemplo. Esse novo conjunto de informações, agora, cobre todo o ano de 2020, desde o primeiro registro da doença no Brasil, permitindo aos pesquisadores entender melhor a evolução da COVID-19 e analisar as novas ‘ondas’ de casos no país”, avalia Medeiros.
A última carga de dados no repositório, feita em agosto de 2020, reunia informações de pacientes, dados de desfecho e exames clínicos e laboratoriais realizados em todo o país pelo Grupo Fleury, e na cidade de São Paulo pelos hospitais Sírio-Libanês e Israelita Albert Einstein. A nova carga reúne dados disponibilizados por essas instituições e também pelo Hospital das Clínicas da Faculdade de Medicina da USP (HC-FM-USP) e pela BP – A Beneficência Portuguesa de São Paulo.
“Havia uma demanda por dados recentes no repositório. O aporte de dados feitos por essas novas instituições ampliou muito a variedade de informações disponíveis na plataforma e a cobertura temporal. Isso permitirá ampliar as pesquisas atuais e a realização de novos estudos mais abrangentes”, estima Medeiros.
As instituições participantes da plataforma disponibilizam, além das informações, infraestrutura, tecnologias e recursos humanos próprios para viabilizar o compartilhamento de dados.
“O Hospital das Clínicas da Faculdade de Medicina da USP está contribuindo com um volume bastante expressivo de dados relativos às internações de milhares de pacientes atendidos em 2020, durante uma extraordinária operação que mobilizou toda a instituição”, diz Tarcisio Eloy Pessoa de Barros Filho, diretor da FM-USP.
“Além do grande volume de informações que aportamos, estamos possibilitando um incremento importante da diversidade de dados que integram esse repositório de dados multi-institucional”, avalia.
A BP também se mobilizou para fornecer dados de qualidade para pesquisas. Além de informações como data de nascimento, sexo, cidade e estado, a instituição disponibilizou todos os resultados de exames laboratoriais de pacientes que coletaram material biológico para o exame para detecção da COVID-19, independentemente do resultado.
“A disponibilização de dados de desfecho permite também acompanhar a evolução dos pacientes. A exportação de dados é totalmente anonimizada, seguindo as tratativas da Lei Geral de Proteção de Dados Pessoais”, sublinha Lilian Quintal Hoffmann, diretora-executiva de tecnologia e operações da BP.
Também integram a iniciativa a Associação Paulista para o Desenvolvimento da Medicina (SPDM), Instituto Pensi de Pesquisa e Ensino em Saúde Infantil – vinculado ao Hospital Infantil Sabará – e Real Hospital Português de Beneficência, em Recife (PE).
Tipos de dados
Os dados são disponibilizados em três categorias: demográficos (gênero, ano de nascimento e região de residência do paciente), de exames clínicos e/ou laboratoriais, além de informações, quando disponíveis, sobre a movimentação do paciente, como internações, por exemplo, e desfecho dos casos, como recuperação ou óbitos.
Com base na análise dos resultados disponíveis no repositório de exames laboratoriais de quase 179 mil pessoas testadas para COVID-19 no Brasil – das quais 33,2 mil com diagnóstico confirmado –, um grupo de pesquisadores brasileiros identificou diferentes perfis clínicos da doença que são influenciados pelo sexo e pela idade do paciente, bem como pela gravidade do quadro (leia mais em agencia.fapesp.br/33927/).
Além de fins científicos, os dados disponíveis na plataforma também têm sido utilizados por empresas para o desenvolvimento de tecnologias voltadas ao combate da COVID-19, como um sistema de inteligência artificial para auxiliar no diagnóstico e prognóstico de doenças criado pela startup DiagoNow.
A plataforma digital, que utiliza dados de pacientes para criar indicadores e auxiliar médicos a tomar decisões clínicas, é capaz de detectar casos falso-negativos de COVID-19 com 95% de precisão utilizando apenas um hemograma.
Para chegar a esse nível de acurácia, os pesquisadores participantes do projeto utilizaram mais de 30 mil amostras de análises de hemograma disponíveis no repositório.
“O sistema ainda não está disponível comercialmente. Estamos avançando em parcerias com o Grupo Fleury e instituições como a Unimed de Florianópolis, a Santa Casa de Ourinhos e a BP, que estão nos ajudando no processo de validação da plataforma”, diz Molina Garcia, estudante de graduação em engenharia de computação na USP, em São Carlos, e líder de estratégia do projeto (leia mais em agencia.fapesp.br/34018/).
A Agência FAPESP licencia notícias via Creative Commons (CC-BY-NC-ND) para que possam ser republicadas gratuitamente e de forma simples por outros veículos digitais ou impressos. A Agência FAPESP deve ser creditada como a fonte do conteúdo que está sendo republicado e o nome do repórter (quando houver) deve ser atribuído. O uso do botão HMTL abaixo permite o atendimento a essas normas, detalhadas na Política de Republicação Digital FAPESP.