Experience On / Mundo dos Dados

Sem alarde, a Meta apresentou o seu modelo de IA Llama 2 Long que pode superar o GPT 3.5 em algumas tarefas

por Elcio Santos - 06/10/2023

Enquanto todos estavam de olho na enxurrada de grandes anúncios da Meta na semana passada, que incluíam novos chatbots com tecnologia de IA e um novo fone de ouvido VR, a empresa também lançou discretamente um novo modelo de IA generativa chamado Llama 2 Long.

Aqui está o que sabemos sobre ele:

  1. O Llama 2 Long foi construído a partir do Llama 2 e passou por “pré-treinamento contínuo no Llama 2 com sequências de treinamento mais longas e em um conjunto de dados onde se ampliou as amostras de textos longos”, informou a Meta.
  2. O modelo pode superar o GPT-3.5 Turbo da OpenAI com janela de contexto de 16.000 caracteres.
  3. Também pode superar o Claude 2 da Anthropic com sua janela de contexto de 100.000 caracteres.

O que tudo isso significa essencialmente é que o Llama 2 Long deve ser muito bom quando se trata de compreender e gerar textos realmente longos.

Um possível caso de uso futuro poderia incluir o resumo de livros inteiros ou a produção de novos.

Fonte: VentureBeat

https://venturebeat.com/ai/meta-quietly-releases-llama-2-long-ai-that-outperforms-gpt-3-5-and-claude-2-on-some-tasks/

Descomplique já

Fale com um dos nossos especialistas em Estratégia do Consumidor