Novo modelo o1 da OpenAI é capaz de ‘pensar’

A OpenAI lançou o modelo o1, focado em raciocínio avançado e auto-verificação, com versões para usuários do ChatGPT e API

OpenAI anunciou o lançamento do modelo o1, que representa um marco em sua busca por inteligência artificial (IA) mais avançada. O o1 — conhecido internamente como Strawberry — é descrito como um modelo de raciocínio que se destaca por sua capacidade de resolver questões complexas, oferecendo duas versões: o1-preview e o1-mini.

Ambas estarão disponíveis para assinantes do ChatGPT Plus e Team a partir desta quinta-feira (12), com usuários das versões Enterprise e Edu recebendo acesso na próxima semana.

tela do chatgpt que mostra o modelo o1 já disponível
(Imagem: OpenAI)

Novas funcionalidades do o1 da OpenAI

Uma das inovações do o1 é sua habilidade de “pensar” antes de fornecer respostas, o que, segundo a OpenAI, ajuda o modelo a reduzir erros de raciocínio comuns em inteligências artificiais. Ele utiliza um processo de raciocínio chamado “cadeia de pensamento”, que simula a análise humana passo a passo para resolver problemas. Essa funcionalidade o torna particularmente eficaz em tarefas complexas, como programação e matemática.

O modelo foi desenvolvido como parte de um projeto interno da OpenAI chamado Q*, que foca em raciocínio avançado. Além de fornecer respostas, o o1 consegue se auto-verificar, revisando suas próprias soluções para minimizar erros.

tela do chatgpt indica que o modelo de IA está pensando antes de responder
Modelo o1 aparece “pensando” (thinking) antes de oferecer uma resposta em demonstração. (Imagem: OpenAI)

Limitações do o1 da OpenAI

  • O modelo o1 traz novidades, mas também algumas limitações.
  • Apesar de suas capacidades avançadas, o o1 pode ser mais lento que seus antecessores em alguns casos, levando até 10 segundos para responder a perguntas mais complexas.
  • Além disso, ainda existe o risco de o modelo gerar “alucinações” — respostas incorretas, mas apresentadas com confiança —, um problema que a OpenAI admite não ter completamente resolvido.
  • Ele não possui funções como navegação na web ou processamento de arquivos e imagens.
  • Além disso, os usuários têm um limite semanal de mensagens: 30 para o o1-preview e 50 para o o1-mini.
  • O custo elevado também é um fator, com o o1-preview custando US$ 15 por milhão de tokens de entrada e US$ 60 por milhão de tokens de saída — valores três e quatro vezes maiores, respectivamente, comparados ao GPT-4o.

Leia mais:

Treinamento com reforço e aplicações práticas

O treinamento do o1 utiliza um novo algoritmo de otimização e aprendizado por reforço, uma técnica que ensina o sistema por meio de recompensas e punições. Isso permite ao o1 resolver problemas por conta própria.

Esse método inclui o uso de dados voltados ao raciocínio, como literatura científica, tornando o modelo ideal para tarefas que envolvem várias etapas, como a análise de e-mails confidenciais ou a formulação de estratégias de marketing.

gráfico de melhorias do o1
Melhorias dos modelos o1 em relação a seus antecessores em diversas áreas. (Imagem: OpenAI)

Testes indicam que o o1 supera o GPT-4o em tarefas como análise de petições jurídicas e jogos de lógica, além de ter um desempenho excepcional em exames de matemática. Em uma prova da Olimpíada Internacional de Matemática, o o1 obteve 83% de acertos, enquanto o GPT-4o ficou em 13%, segundo a empresa.

Futuro dos modelos de IA

A OpenAI está focada em expandir as habilidades de raciocínio do o1 para além de suas capacidades atuais. A empresa planeja desenvolver futuras versões capazes de raciocinar por períodos mais longos — horas, dias ou até semanas —, visando criar sistemas autônomos ainda mais eficientes em tarefas complexas e em áreas como medicina e engenharia.

OLHAR DIGITAL