Mercado em alerta: empresas de IA estão ficando sem dados para treinamento
Os dados desempenham um papel central na economia da Inteligência Artificial. Os dados são a força vital de um modelo, tanto na função básica quanto na qualidade.
E quanto mais naturais forem os dados – no sentjdo de produzidos pela atividade humana – que um sistema de IA tiver para treinar, melhor esse sistema se torna.
Infelizmente para as empresas de IA, acontece que os dados naturais são um recurso finito – e se essa torneira secar, elas poderão estar com problemas sérios.
Um estudo da Epoch AI publicado em 2022 estimou que as empresas de IA podem ficar sem dados de alta qualidade para treinamento até 2026, enquanto as fontes de dados de texto e imagem de baixa qualidade podem secar a qualquer momento entre 2030 e 2060 .
É uma situação complicada para as empresas de IA, dada a quantidade de dados que os sistemas de IA precisam operar e melhorar.
O uso de dados sintéticos – dados gerados pelos modelos de IA para treinar novos modelos – vem sendo tentado, mas pode não ser uma solução viável, pois a falta de variação no conjunto de dados gera resultados estranhos e distorcidos.
Tal como está, a solução mais prática para esse problema iminente estaria em parcerias de dados, nas quais basicamente, uma empresa ou instituição com um tesouro de dados de alta qualidade fecha um acordo com uma empresa de IA para usar esses dados.
Considerando que a maioria dos conjuntos de dados de IA que estão sendo usados atualmente para treinar sistemas de IA são feitos a partir de dados originalmente criados por, bem, todos nós online, as parcerias de dados podem não ser o pior caminho a percorrer. Mas, à medida que os dados se tornam cada vez mais valiosos, certamente será interessante ver quantas empresas de IA podem realmente competir por conjuntos de dados – assim como quantas instituições, ou mesmo indivíduos, estarão dispostas a fornecer seus dados para as empresas de IA.
E, mesmo assim, alertam os pesquisadores, não há garantia de que as fontes de dados jamais sequem. Por mais infinito que a Internet pareça, poucas coisas são realmente infinitas.
Fonte: Futurism
https://futurism.com/ai-companies-training-data
Alguns anos atrás, fomos contratados por uma empresa do setor financeiro para criar uma estrutura de data analytics que garantisse...