Claude 3.5 Sonnet: nova IA da Anthropic diz superar GPT-4o e Gemini

O modelo de IA Claude 3.5 Sonnet da Anthropic promete avanços significativos sobre concorrentes como GPT-4o da OpenAI e Gemini do Google

Anthropic introduziu seu mais recente modelo de inteligência artificial (IA), Claude 3.5 Sonnet, alegando que ele supera modelos líderes como GPT-4o da OpenAI e Gemini do Google em várias tarefas. O modelo já está acessível para usuários via web e iOS, com disponibilidade estendida também para desenvolvedores.

O Claude 3.5 Sonnet chega posicionado como a opção intermediária na linha de modelos de IA da Anthropic, que inclui Haiku como modelo de entrada e Opus como modelo de alto desempenho.

Desempenho em benchmarks

Embora os benchmarks devam ser vistos com cautela devido à variabilidade e seletividade nos relatórios, o desempenho do Claude 3.5 Sonnet é notável. Ele superou GPT-4o, Gemini 1.5 Pro e Llama 3 400B da Meta em sete dos nove benchmarks gerais e quatro dos cinco benchmarks de visão.

Apesar de ser um modelo intermediário, o Claude 3.5 Sonnet supostamente supera o anteriormente topo de linha Claude 3 Opus de forma significativa e opera com o dobro da velocidade de seu predecessor.

claude 3.5 sonnet
Anthropic apresenta testes de benchmarks do novo Claude 3.5 Sonnet. (Imagem: Anthropic / Divulgação)

Capacidades e recursos

A Anthropic afirma que Claude 3.5 Sonnet se destaca em várias áreas:

  • Escrita e tradução de código: capacidade aprimorada de escrever e traduzir código.
  • Fluxos de trabalho em múltiplas etapas: melhor manuseio de fluxos de trabalho complexos.
  • Interpretação de dados: melhor interpretação de gráficos e tabelas.
  • Transcrição de texto: transcrição mais precisa de texto a partir de imagens.
  • Escrita similar à humana: maior proficiência em entender humor e escrever de forma mais humana.

Artifacts e a visão estratégica da Anthropic

Um recurso significativo introduzido junto com Claude 3.5 Sonnet é o Artifacts. Esta ferramenta permite que os usuários interajam diretamente com os resultados gerados pelo Claude. Por exemplo, os usuários podem editar resultados de design ou e-mails dentro do aplicativo Claude sem precisar de editores de texto externos. Este recurso visa transformar Claude de um simples chatbot em um assistente de IA versátil.

O Artifacts está alinhado com a visão da Anthropic de focar em soluções empresariais. A empresa imagina Claude evoluindo para uma ferramenta que ajuda empresas a centralizar conhecimentos, documentos e trabalhos em andamento de forma segura em uma plataforma única, semelhante a ferramentas como Notion ou Slack, mas com capacidades avançadas de IA em seu núcleo.