Cada vez mais, no entanto, as pessoas me perguntam se ela é apenas um modismo ou de fato um campo com potencial extraordinário, uma alavanca moderna.
Em geral, a resposta envolve as aplicações e os usos científicos dos dados.
Os motores de busca e os sistemas de recomendação na Internet, o reconhecimento de imagem e voz, o planeamento de rotas de voos, a detecção de riscos e fraudes…
O céu é o limite.
Mas agora vamos falar sobre o uso da ciência dos dados em torno de um tema que não apenas entrou no nosso radar, como pousou em nossa vida e está criando profundas ansiedades:
pandemias!
Para começar, temos que dizer que a pandemia gerada pelo COVID-19 é um dado da realidade.
Trata-se de uma emergência mundial e atual contra a qual se pode tomar várias ações: criar uma conscientização mais efetiva.
Entretanto, não podemos voltar atrás no tempo e prevenir a ocorrência do surto.
Se isso seria possível?
O exemplo de Taiwan não me deixa mentir.
As autoridades da pequena ilha que fica a meros 130 km da costa da China decidiram usar uma arma simples mas poderosa.
Análise de dados – para antecipar os movimentos essenciais para conter esse vírus que, em outros quadrantes do planeta, tem se mostrado invencível.
Os resultados foram impressionantes.
Apesar dos seus quase 24 milhões de habitantes, até 19 de setembro, Taiwan tivera apenas 506 infectados e 7 (sete!) mortos.
Compare com o Brasil.
Nossa população está em torno de 210 milhões, ou seja, quase 10 vezes mais a população da ilha situada no Mar da China.
Em compensação, na mesma data, já tivemos quase 4,5 milhões de infectados (9 mil vezes mais!) e quase 136 mil mortos (quase 20 mil vezes mais do que Taiwan!).
Resumindo, parece que não podemos impedir o surgimento de novos vírus, mutações letais que nascem principalmente do contato humano com ambientes que não haviam sido perturbados.
Mas temos a capacidade de evitar que isso saia do controle e se transforme em epidemias, pandemias e tragédias.
Taiwan saiu na frente, mas outros países logo saíram correndo atrás do prejuízo.
Em sua maioria, porém, utilizando metodologias históricas, como relatórios de pesquisadores e registros hospitalares.
Eles costumam ser confiáveis, embora ofereçam resultados moderados na melhor das hipóteses.
Metodologias mais atuais, incluindo rastreamento de telefone celular e mineração de dados de mecanismos de pesquisa e mídia social.
Além de outras técnicas de ciência de dados, podem ajudar a dar uma imagem mais rápida e progressivamente refinada de onde as doenças estão se manifestando e onde podem se espalhar em seguida.
O fato é que o uso das mais avançadas técnicas de análise de dados pode desempenhar um papel importante na análise de testes em larga escala de indivíduos.
Isso nos permitiria compreender os principais fatores de risco e proteger melhor os indivíduos com maior risco de infecção.
Quanto mais informações houver, mais precisas serão essas previsões.
A inovação na capacidade de previsão mudou inúmeras empresas nos últimos 20 anos.
Organizações como BlueDot e Metabiota utilizam um escopo de algoritmos de processamento de linguagem natural (PNL).
A fim de filtrar veículos de notícias e relatórios oficiais de saúde em vários idiomas ao redor do mundo.
Seus dispositivos preditivos podem, da mesma forma, basear-se em informações de viagens aéreas para avaliar o risco de que os centros de trânsito possam ver indivíduos contaminados aparecendo ou saindo.
Qual é a probabilidade de eles sucumbirem à doença?
Esses dados podem incorporar históricos médicos fundamentais das pessoas.
Os resultados são sensivelmente precisos.
Por exemplo, o relatório público mais recente da Metabiota em 25 de fevereiro antecipou que em 3 de março, haveria um total de 1.270.000 casos de COVID-19 em todo o mundo.
Este número foi ultrapassado por cerca de 30.000, mas Mark Gallivan, o então Diretor de Ciência de Dados da empresa, disse que isso ainda estava dentro da faixa de erro.
Além disso, registrou que as nações com maior probabilidade de relatar novos casos seriam China, Itália, Irã e Estados Unidos da América.
O sistema DeepMind AI do Google está sendo usado para distinguir os atributos do vírus, o que pode ajudar a entender como ele funciona.
Esses dados têm sido úteis para determinar quais medicamentos desenvolver.
Outros incorporaram a tecnologia desenvolvida pela BenevolentAI, startup de bioinformática sediada no Reino Unido.
Que está usando inteligência artificial para encontrar tratamentos existentes promissores para diferentes doenças, que poderiam ser eficazes no tratamento de COVID-19.
O uso da tecnologia de reconhecimento facial SenseTime pela China e do software de detecção de temperatura para detectar indivíduos que podem ter febre e podem estar propensos a ter a infecção também ajudou.
Uma inovação semelhante alimenta os ‘capacetes inteligentes’ que são utilizados pelas autoridades no território de Sichuan para detectar indivíduos com febre.
O governo chinês também construiu um sistema de monitoramento chamado Código de Saúde que emprega big data para identificar e avaliar o risco de cada indivíduo.
Os residentes recebem um código de cor, que eles podem obter por meio dos aplicativos convencionais WeChat ou AliPay para mostrar se devem ser isolados ou autorizados a sair ao público.
Ao contrário dos testes médicos que são escassos, caros e geralmente são entregues com atrasos, esta abordagem de personalização digital baseada em dados clínicos pode ser aplicada rapidamente e é muito fácil de escalar.
Isso permitiria uma alocação de ativos melhor e mais atraente no caso de equipamentos médicos raros, por exemplo, unidades de teste, máscaras de proteção e leitos hospitalares.
Isso pode nos capacitar com os modelos corretos e permitir uma saída mais segura da quarentena a uma taxa muito mais rápida do que o permitido pelas práticas recomendadas atuais de teste segregado para COVID-19.
Sob o qual qualquer pessoa infectada e seus contatos permaneceriam em confinamento, independentemente se são geralmente seguros ou se apresentam sintomas de doença grave.
Podemos aprender muito com a forma como o UNICEF Innovation Lab, a Flowminder e outras organizações usaram as informações sobre mobilidade humana e os dados de telecomunicações durante o surto de Ebola na África Ocidental.
O objetivo primário subjacente era compreender as tendências da mobilidade humana no que diz respeito às medidas de bloqueio e avaliar o perigo da doença progredir em uma determinada região.
Na prática, usou-se um aplicativo desenvolvido em código aberto que identificava aqueles expostos ao vírus e construiu-se um enorme banco de dados de dados.
Que incorporava nome, sexo, idade, localização, médicos história e vários outros identificadores.
Na aplicação de análises de big data, utilizou-se registros telefônicos de 2013 no Senegal para sobrepor surtos de infecção anteriores.
Nos padrões de tráfego e assim prever o movimento e o crescimento do ebola dentro do país.
Embora uma parte significativa da resposta ao Ebola seja estabelecida na infraestrutura física e nas operações, está claro que a resposta é aumentada.
Um segundo caminho encorajador é a mineração de dados de mídia social e atividade de mecanismo de pesquisa, que pode mostrar rapidamente onde um surto está ocorrendo.
No entanto, os dados de compartilhamento social e consultas de mecanismo de pesquisa podem ser enganosos e não devem ser confiáveis exclusivamente.
Em vez disso, as organizações de saúde estão consolidando informações dessas fontes com conjuntos de dados médicos tradicionais e usando habilidades médicas ao dissecar tendências.
Daniel Bausch, o Diretor do Reino Unido, vê um potencial incrível nos conjuntos de dados coletados nas redes sociais.
Recentemente, o Laboratório de Big Data do Escritório de Projetos de Estratégia de Desenvolvimento de Nizhny Novgorod.
Desenvolveu um modelo matemático para prever a disseminação do COVID-19.
A equipe observou continuamente a pesquisa russa e global sobre COVID-19.
A análise incorporou algumas dezenas de cidades urbanas, a fim de distinguir aquelas que possuem parâmetros epidemiológicos mais próximos dos seus.
Contudo, o modelo desenvolvido auxilia na previsão da pandemia com uma precisão de 2,5%.
Seu trabalho seria criar mecanismos de governança de dados para descobrir a harmonia entre os interesses públicos conflitantes, garantindo a segurança individual.
Se você reler o que escrevemos com atenção, vai perceber que o ponto de partida não está muito longe do senso comum.
E a maior contribuição dos novos avanços tecnológicos é exatamente a possibilidade de descomplicar os processos.
Na verdade, a prevenção às pandemias, o segredo é ter a experiência e a expertise para coletar.
Além de disseminar e utilizar as informações, ao mesmo tempo em que garanta o respeito às melhores práticas éticas.
Exatamente o mesmo modus operandi que, aqui na Always On, utilizamos a serviço dos nossos clientes.
Em suma, fale com um dos nossos especialistas e descubra se Ciência de dados em Tempos de Crise realmente funciona na prática.
Amazon Style usa engenharia de dados para B2B para combinar compras presenciais e digitais! A Amazon abriu sua primeira loja...