ChatGPT ganha capacidade agente para pesquisas complexas

A OpenAI está lançando uma poderosa capacidade agente que permite ao ChatGPT realizar tarefas de pesquisa complexas e em múltiplas etapas online. Esse recurso, chamado de Deep Research, supostamente realiza em minutos o que poderia levar horas ou até dias para um pesquisador humano.

A OpenAI descreve o Deep Research como um marco significativo em sua jornada rumo à inteligência geral artificial (AGI).

‘A capacidade de sintetizar conhecimento é um pré-requisito para a criação de novos conhecimentos’, afirma a OpenAI. ‘Por essa razão, o Deep Research marca um passo importante em direção ao nosso objetivo mais amplo de desenvolver a AGI.’

Inteligência Artificial Agente permite ao ChatGPT auxiliar em pesquisas complexas

O Deep Research capacita o ChatGPT a encontrar, analisar e sintetizar informações de centenas de fontes online de maneira autônoma. Com apenas um comando do usuário, a ferramenta pode entregar um relatório abrangente, comparável ao resultado de um analista de pesquisa, segundo a OpenAI.

Baseando-se em uma variante do modelo ‘o3’ da OpenAI, o objetivo é liberar os usuários da coleta de informações que demanda tempo e esforço. Seja uma análise competitiva de plataformas de streaming, uma revisão de políticas informada ou até mesmo recomendações personalizadas para uma nova bicicleta de uso diário, o Deep Research promete resultados precisos e confiáveis.

Importante mencionar que cada resultado inclui citações completas e documentação transparente, permitindo que os usuários verifiquem os achados com facilidade.

A ferramenta parece ser particularmente habilidosa em descobrir insights de nicho ou não intuitivos, tornando-se um ativo inestimável em indústrias como finanças, ciência, formulação de políticas e engenharia. Mas a OpenAI também enxerga o Deep Research sendo útil para o usuário comum, como compradores em busca de recomendações hiperpersonalizadas ou de um produto específico.

Este último recurso de capacidade agente opera por meio da interface do usuário do ChatGPT; os usuários simplesmente selecionam a opção ‘Deep Research’ no compositor de mensagens e digitam sua consulta. Arquivos de suporte ou planilhas também podem ser carregados para contexto adicional.

Após iniciado, a IA embarca em um rigoroso processo em várias etapas, que pode levar de 5 a 30 minutos para ser concluído. Uma barra lateral fornece atualizações sobre as ações tomadas e as fontes consultadas. Os usuários podem continuar com outras tarefas e serão notificados quando o relatório final estiver pronto.

Os resultados são apresentados no chat como relatórios detalhados e bem documentados. Nas próximas semanas, a OpenAI planeja aprimorar ainda mais esses resultados, incorporando imagens, visualizações de dados e gráficos para entregar ainda mais clareza e contexto.

Diferentemente do GPT-4o – que se destaca em conversas multimodais em tempo real – o Deep Research prioriza profundidade e detalhe. Sua capacidade de citar fontes rigorosamente e fornecer análises abrangentes o diferencia, mudando o foco de respostas rápidas e resumidas para insights bem documentados e em nível de pesquisa.

Projetado para desafios do mundo real

O Deep Research utiliza metodologias de treinamento sofisticadas, baseadas em tarefas de navegação e raciocínio do mundo real em diversos domínios. Seu modelo foi treinado por meio de aprendizado por reforço para planejar e executar autonomamente processos de pesquisa em várias etapas, incluindo retroceder e refinar adaptativamente sua abordagem conforme novas informações se tornam disponíveis.

A ferramenta pode navegar em arquivos carregados pelo usuário, gerar e iterar gráficos usando Python, incorporar mídias como imagens geradas e páginas da web em respostas, e citar sentenças ou passagens exatas de suas fontes. O resultado desse extenso treinamento é um agente altamente capaz de lidar com problemas complexos do mundo real.

A OpenAI avaliou o Deep Research em um conjunto amplo de exames em nível de especialista conhecidos como ‘Exame Final da Humanidade’. Os exames – compostos de mais de 3.000 perguntas cobrindo tópicos de ciência de foguetes e linguística a ecologia e clássicos – testam a competência de uma IA em resolver problemas multifacetados.

Os resultados foram impressionantes, com o modelo alcançando uma precisão recorde de 26,6% nesses domínios:

GPT-4o: 3,3%
Grok-2: 3,8%
Claude 3.5 Sonnet: 4,3%
OpenAI o1: 9,1%
DeepSeek-R1: 9,4%
Deep Research: 26,6% (com navegação + ferramentas Python)

O Deep Research também atingiu um novo estado da arte de desempenho no benchmark GAIA, que avalia modelos de IA com base em perguntas do mundo real que exigem raciocínio, fluência multimodal e proficiência no uso de ferramentas. O Deep Research liderou o ranking com uma pontuação de 72,57%.

Limitações e desafios

Embora a capacidade agente IA do Deep Research no ChatGPT signifique um avanço ousado, a OpenAI reconhece que a tecnologia ainda está em seus estágios iniciais e vem com limitações.

O sistema ocasionalmente ‘alucina’ fatos ou oferece inferências incorretas, embora em uma taxa notavelmente reduzida em comparação com os modelos GPT existentes, de acordo com a OpenAI. Ele também enfrenta desafios para diferenciar entre fontes autoritativas e conteúdo especulativo, e tem dificuldade em calibrar seus níveis de confiança—frequentemente exibindo certeza indevida para achados potencialmente incertos.

Erros de formatação menores em relatórios e citações, bem como atrasos na iniciação das tarefas, também podem frustrar os usuários iniciais. A OpenAI afirma que esses problemas devem melhorar com o tempo, com mais uso e refinamentos iterativos.

A OpenAI está lançando a capacidade gradualmente, começando com usuários Pro, que terão acesso a até 100 consultas por mês. Os níveis Plus e Team seguirão, com acesso Enterprise chegando em seguida.

Residentes do Reino Unido, Suíça e Área Econômica Europeia ainda não podem acessar o recurso, mas a OpenAI afirma que está trabalhando para expandir sua disponibilização nessas regiões.

Nas próximas semanas, a OpenAI expandirá o recurso para as plataformas móveis e desktop do ChatGPT. A visão de longo prazo inclui habilitar conexões a fontes de dados baseadas em assinatura ou proprietárias, aprimorando ainda mais a robustez e personalização de seus resultados.

Olhando mais à frente, a OpenAI enxerga a integração do Deep Research com o ‘Operator’, uma capacidade de chatbot existente que realiza ações no mundo real. Essa integração permitiria ao ChatGPT lidar de forma perfeita com tarefas que exigem pesquisa online assíncrona e execução no mundo real.