Grok: agora IA do X/Twitter entende imagens (e piadas), diz Musk

Os usuários pagantes do X, que têm acesso ao Grok, podem fazer upload de imagens no chatbot e, em seguida, fazer perguntas sobre elas

xAI, empresa de inteligência artificial (IA) de Elon Musk, adicionou compreensão de imagens ao Grok, chatbot do X (antigo Twitter) – outra empresa de Musk. O bilionário disse, numa postagem na rede social, que a IA agora entende piadas também graças a essa nova capacidade.

Os usuários pagantes do X, que têm acesso ao Grok, podem fazer upload de imagens no chatbot e, em seguida, fazer perguntas sobre elas. Na postagem em questão, Musk diz que a função ainda está em estágio inicial. Ainda segundo o bilionário, ela vai “melhorar rapidamente“.

Além de imagens, Grok vai entender documentos em breve, segundo Elon Musk

Um usuário reclamou, na rede social, que o Grok não entende alguns tipos de arquivo – por exemplo, PDFs. “Não por muito tempo“, respondeu Musk. “Estamos terminando em meses o que levou anos para todos os outros“, acrescentou.

grok X
Grok, chatbot de IA do X/Twitter, agora entende imagens e piadas (Imagem: Ascannio/Shutterstock)

Em agosto, a empresa de IA de Musk lançou o modelo Grok-2, versão aprimorada do chatbot que gerava imagens (caóticas, diga-se) usando o modelo FLUX.1 da Black Forest Labs. Como costuma ser nos negócios de Musk, o Grok-2 foi disponibilizado apenas para desenvolvedores e usuários pagantes do X.Play Video

  • Na época, a xAI disse que uma futura versão adicionaria compreensão multimodal ao Grok no X e ao modelo que oferece por meio da API para desenvolvedores, segundo o TechCrunch.

empresa de IA de Musk trabalha para melhorar as capacidades do Grok. “No entanto, isso ainda não impediu que o Grok fornecesse informações enganosas sobre a eleição presidencial [dos EUA]“, pondera o Engadget. “Por enquanto, é melhor abordar a IA preferida de Musk com uma boa dose de ceticismo.

Nova IA da Meta cria podcasts a partir de texto

Enquanto o Grok explica imagens e piadas, o NotebookLlama, da Meta, gera podcasts a partir de texto. É a resposta da big tech ao NotebookLM, do Google (que faz essencialmente o mesmo).

Robô de IA humanoide trabalhando no estúdio de podcast
NotebookLlama, a Meta, faz o mesmo que o NotebookLM, do Google (Imagem: Stock-Asso/Shutterstock)

Primeiro, a IA cria uma transcrição de um arquivo — por exemplo, um PDF de um artigo, notícias ou uma postagem de um site. Então, adiciona “dramatização” e interrupções na transcrição para adaptar o texto para fala.