Experience On / CRM

Como a ciência de dados pode ajudar a prevenir pandemias no futuro?

por Elcio Santos - 02/10/2020

Uma coisa é indiscutível: o interesse pela ciência de dados vem crescendo exponencialmente.

Cada vez mais, no entanto, as pessoas me perguntam se ela é apenas um modismo ou de fato um campo com potencial extraordinário, uma alavanca moderna, capaz de mover o mundo em uma direção mais produtiva.

Em geral, a resposta envolve as aplicações e os usos científicos dos dados.

Os motores de busca e os sistemas de recomendação na Internet, o reconhecimento de imagem e voz, o planeamento de rotas de voos, a detecção de riscos e fraudes…

O céu é o limite.

Mas agora vamos falar sobre o uso da ciência dos dados em torno de um tema que não apenas entrou no nosso radar, como pousou em nossa vida e está criando profundas ansiedades: pandemias.

A crise atual poderia ter sido evitada?

Para começar, temos que dizer que a pandemia gerada pelo COVID-19 é um dado da realidade.

Trata-se de uma emergência mundial e atual contra a qual se pode tomar várias ações: criar uma conscientização mais efetiva, estabelecer diretrizes para a ação dos especialistas em saúde, direcionar grupos de contaminação, limitar o contágio, otimizar recursos que por natureza são escassos…

Entretanto, não podemos voltar atrás no tempo e prevenir a ocorrência do surto.

Se isso seria possível?

O exemplo de Taiwan não me deixa mentir.

As autoridades da pequena ilha que fica a meros 130 km da costa da China decidiram usar uma arma simples mas poderosa — análise de dados – para antecipar os movimentos essenciais para conter esse vírus que, em outros quadrantes do planeta, tem se mostrado invencível.

Os resultados foram impressionantes.

Apesar dos seus quase 24 milhões de habitantes, até 19 de setembro, Taiwan tivera apenas 506 infectados e 7 (sete!) mortos.

Fonte

Compare com o Brasil.

Nossa população está em torno de 210 milhões, ou seja, quase 10 vezes mais a população da ilha situada no Mar da China.

Em compensação, na mesma data, já tivemos quase 4,5 milhões de infectados (9 mil vezes mais!) e quase 136 mil mortos (quase 20 mil vezes mais do que Taiwan!).

Resumindo, parece que não podemos impedir o surgimento de novos vírus, mutações letais que nascem principalmente do contato humano com ambientes que não haviam sido perturbados.

Mas temos a capacidade de evitar que isso saia do controle e se transforme em epidemias, pandemias e tragédias.

A análise de dados pode fazer a diferença

Taiwan saiu na frente, mas outros países logo saíram correndo atrás do prejuízo.

Em sua maioria, porém, utilizando metodologias históricas, como relatórios de pesquisadores e registros hospitalares.

Eles costumam ser confiáveis, embora ofereçam resultados moderados na melhor das hipóteses.

Metodologias mais atuais, incluindo rastreamento de telefone celular e mineração de dados de mecanismos de pesquisa e mídia social, além de outras técnicas de ciência de dados, podem ajudar a dar uma imagem mais rápida e progressivamente refinada de onde as doenças estão se manifestando e onde podem se espalhar em seguida.

O fato é que o uso das mais avançadas técnicas de análise de dados pode desempenhar um papel importante na análise de testes em larga escala de indivíduos, conectando esses resultados com os atributos de saúde anônimos de pacientes hospitalizados.

Isso nos permitiria compreender os principais fatores de risco e proteger melhor os indivíduos com maior risco de infecção.

Quanto mais informações houver, mais precisas serão essas previsões.

O poder da previsão

A inovação na capacidade de previsão mudou inúmeras empresas nos últimos 20 anos.

Organizações como BlueDot e Metabiota utilizam um escopo de algoritmos de processamento de linguagem natural (PNL) para filtrar veículos de notícias e relatórios oficiais de saúde em vários idiomas ao redor do mundo.

Seus dispositivos preditivos podem, da mesma forma, basear-se em informações de viagens aéreas para avaliar o risco de que os centros de trânsito possam ver indivíduos contaminados aparecendo ou saindo.

Utilizando diferentes fontes de big data, os modelos de aprendizado de máquina podem ser treinados para quantificar o risco clínico de uma pessoa de desenvolver doença grave se ela contrair uma infecção grave como COVID-19: qual é a probabilidade de que exijam atendimento especializado, para o qual os ativos são limitados?

Qual é a probabilidade de eles sucumbirem à doença?

Esses dados podem incorporar históricos médicos fundamentais das pessoas.

Os resultados são sensivelmente precisos.

Por exemplo, o relatório público mais recente da Metabiota em 25 de fevereiro antecipou que em 3 de março, haveria um total de 1.270.000 casos de COVID-19 em todo o mundo.

Este número foi ultrapassado por cerca de 30.000, mas Mark Gallivan, o então Diretor de Ciência de Dados da empresa, disse que isso ainda estava dentro da faixa de erro.

Além disso, registrou que as nações com maior probabilidade de relatar novos casos seriam China, Itália, Irã e Estados Unidos da América.

Como algumas tecnologias estão sendo usadas

O sistema DeepMind AI do Google está sendo usado para distinguir os atributos do vírus, o que pode ajudar a entender como ele funciona.

Esses dados têm sido úteis para determinar quais medicamentos desenvolver.

Outros incorporaram a tecnologia desenvolvida pela BenevolentAI, startup de bioinformática sediada no Reino Unido, que está usando inteligência artificial para encontrar tratamentos existentes promissores para diferentes doenças, que poderiam ser eficazes no tratamento de COVID-19.

O uso da tecnologia de reconhecimento facial SenseTime pela China e do software de detecção de temperatura para detectar indivíduos que podem ter febre e podem estar propensos a ter a infecção também ajudou.

Uma inovação semelhante alimenta os ‘capacetes inteligentes’ que são utilizados pelas autoridades no território de Sichuan para detectar indivíduos com febre.

O governo chinês também construiu um sistema de monitoramento chamado Código de Saúde que emprega big data para identificar e avaliar o risco de cada indivíduo, dependendo de seu histórico de viagens, a quantidade de tempo que eles passaram em pontos de infecção e a exposição potencial a indivíduos com o vírus.

Os residentes recebem um código de cor (vermelho, amarelo ou verde), que eles podem obter por meio dos aplicativos convencionais WeChat ou AliPay para mostrar se devem ser isolados ou autorizados a sair ao público.

Ao contrário dos testes médicos que são escassos, caros e geralmente são entregues com atrasos, esta abordagem de personalização digital baseada em dados clínicos pode ser aplicada rapidamente e é muito fácil de escalar.

Isso permitiria uma alocação de ativos melhor e mais atraente no caso de equipamentos médicos raros, por exemplo, unidades de teste, máscaras de proteção e leitos hospitalares.

Isso pode nos capacitar com os modelos corretos e permitir uma saída mais segura da quarentena a uma taxa muito mais rápida do que o permitido pelas práticas recomendadas atuais de teste segregado para COVID-19, sob o qual qualquer pessoa infectada e seus contatos permaneceriam em confinamento, independentemente se são geralmente seguros ou se apresentam sintomas de doença grave.

Mineração de dados

Podemos aprender muito com a forma como o UNICEF Innovation Lab, a Flowminder e outras organizações usaram as informações sobre mobilidade humana e os dados de telecomunicações durante o surto de Ebola na África Ocidental.

O objetivo primário subjacente era compreender as tendências da mobilidade humana no que diz respeito às medidas de bloqueio e avaliar o perigo da doença progredir em uma determinada região.

Na prática, usou-se um aplicativo desenvolvido em código aberto que identificava aqueles expostos ao vírus e construiu-se um enorme banco de dados de dados de pacientes que incorporava nome, sexo, idade, localização, médicos história e vários outros identificadores.

Na aplicação de análises de big data, utilizou-se registros telefônicos de 2013 no Senegal para sobrepor surtos de infecção anteriores nos padrões de tráfego e assim prever o movimento e o crescimento do ebola dentro do país.

Embora uma parte significativa da resposta ao Ebola seja estabelecida na infraestrutura física e nas operações, está claro que a resposta é aumentada pela capacidade de aproveitar os dados.

Um segundo caminho encorajador é a mineração de dados de mídia social e atividade de mecanismo de pesquisa, que pode mostrar rapidamente onde um surto está ocorrendo.

No entanto, os dados de compartilhamento social e consultas de mecanismo de pesquisa podem ser enganosos e não devem ser confiáveis exclusivamente.

Em vez disso, as organizações de saúde estão consolidando informações dessas fontes com conjuntos de dados médicos tradicionais e usando habilidades médicas ao dissecar tendências.

Daniel Bausch, o Diretor da Equipe de Apoio Rápido à Saúde Pública do Reino Unido, vê um potencial incrível nos conjuntos de dados coletados nas redes sociais.

Modelos matemáticos

Recentemente, o Laboratório de Big Data do Escritório de Projetos de Estratégia de Desenvolvimento de Nizhny Novgorod desenvolveu um modelo matemático para prever a disseminação do COVID-19.

O modelo usou as informações sobre a maioria das nações e distritos que publicaram insights COVID-19, incluindo 297 regiões do mundo e 21 territórios na Itália.

A equipe observou continuamente a pesquisa russa e global sobre COVID-19. Isso significa que eles poderiam reunir as informações para o modelo em qualquer parte do mundo, tanto agregadas por nação quanto distribuídas por região e territórios menores.

A análise incorporou algumas dezenas de cidades urbanas, a fim de distinguir aquelas que possuem parâmetros epidemiológicos mais próximos dos seus (políticas, tamanho e densidade populacional). O modelo desenvolvido auxilia na previsão da pandemia com uma precisão de 2,5%.

Uma abordagem a ser adotada é estabelecer comitês éticos independentes ou fundos de dados. Seu trabalho seria criar mecanismos de governança de dados para descobrir a harmonia entre os interesses públicos conflitantes, garantindo a segurança individual.

Ciência de Dados pode ser descomplicado

Se você reler o que escrevemos com atenção, vai perceber que o ponto de partida não está muito longe do senso comum.

E a maior contribuição dos novos avanços tecnológicos é exatamente a possibilidade de descomplicar os processos.

No caso da prevenção às pandemias, o segredo é ter a experiência e a expertise para coletar, disseminar e utilizar as informações, ao mesmo tempo em que garanta o respeito às melhores práticas éticas.

Exatamente o mesmo modus operandi que, aqui na Always On, utilizamos a serviço dos nossos clientes.

Quer saber mais sobre ciência de dados?

Fale com um dos nossos especialistas.

Uma última coisa: parte das informações discutidas neste post, foram obtidas no blog upGrad.

Descomplique já

Fale com um dos nossos especialistas em Estratégia do Consumidor