O papel da IA na formulação de hipóteses de pesquisa
Elaborar uma hipótese de pesquisa única e promissora é uma habilidade fundamental para qualquer cientista. Contudo, esse processo pode ser demorado: novos candidatos a PhD podem gastar o primeiro ano de seu programa decidindo exatamente o que explorar em seus experimentos. Mas e se a inteligência artificial pudesse ajudar?
Colaboração entre humanos e IA
Pesquisadores do MIT desenvolveram uma maneira de gerar e avaliar autonomamente hipóteses de pesquisa promissoras em diversos campos, por meio da colaboração entre humanos e IA. Em um novo artigo, eles descrevem como utilizaram essa estrutura para criar hipóteses baseadas em evidências que se alinham às necessidades de pesquisa não atendidas no campo de materiais inspirados biologicamente.
Publicação e coautores
Publicado na Advanced Materials, o estudo foi coautorado por Alireza Ghafarollahi, pós-doutorando no Laboratório de Mecânica Atomística e Molecular (LAMM), e Markus Buehler, professor no MIT nas áreas de Engenharia Civil e Ambiental e Engenharia Mecânica, além de diretor do LAMM.
Framework SciAgents
O framework, chamado SciAgents, consiste em múltiplos agentes de IA, cada um com capacidades específicas e acesso a dados, que utilizam métodos de “raciocínio gráfico”, onde modelos de IA utilizam um gráfico de conhecimento que organiza e define relações entre diversos conceitos científicos. Essa abordagem multiagente imita a forma como sistemas biológicos se organizam como grupos de blocos elementares de construção.
“Usando múltiplos agentes de IA, tentamos simular o processo pelo qual comunidades de cientistas fazem descobertas,” diz Buehler. “Nossa busca é simular o processo de descoberta, explorando se sistemas de IA podem ser criativos e fazer descobertas.”
Automatizando boas ideias
Modelos de linguagem grande (LLMs) têm mostrado uma habilidade impressionante para responder perguntas e resumir informações, mas são limitados na geração de novas ideias do zero. Os pesquisadores do MIT projetaram um sistema que permite aos modelos de IA realizar um processo mais sofisticado, extrapolando e criando novo conhecimento.
Gráfico de conhecimento ontológico
A base da abordagem é um gráfico de conhecimento ontológico, que organiza e faz conexões entre diversos conceitos científicos. Para criar os gráficos, os pesquisadores alimentaram um conjunto de artigos científicos em um modelo de IA generativo. Em trabalho anterior, Buehler usou a teoria das categorias para ajudar o modelo de IA a desenvolver abstrações de conceitos científicos como gráficos, permitindo uma análise por outros modelos através do raciocínio gráfico.
Agentes especializados
No sistema de descoberta científica, diversos modelos são especializados para desempenhar funções específicas. A maioria dos componentes foi construída com base nos modelos da série ChatGPT-4 da OpenAI, usando a técnica de aprendizado em contexto. Os agentes interagem para resolver um problema complexo coletivamente. O primeiro passo é gerar a hipótese de pesquisa, seguido por interações dos modelos de linguagem.
Validação e experimentos
Para validar sua abordagem, os pesquisadores construíram um gráfico de conhecimento baseado nas palavras “seda” e “intensivo em energia”. O modelo “Scientist 1” propôs integrar seda com pigmentos de dente-de-leão para criar biomateriais com propriedades ópticas e mecânicas aprimoradas. O modelo “Scientist 2” sugeriu ferramentas específicas de simulação, enquanto o modelo “Critic” destacou pontos fortes e fracos da proposta.
Futuro e impacto
Os pesquisadores esperam incorporar novas ferramentas para recuperação de informações e simulações em seus frameworks. Desde a liberação de um preprint com detalhes de código aberto, foram contatados por muitas pessoas interessadas em usar os frameworks em diversos campos científicos e até mesmo em finanças e cibersegurança.
“Queremos um sistema que aprofunde as melhores ideias, formulando as melhores hipóteses e prevendo com precisão comportamentos emergentes. Nossa visão é tornar isso fácil de usar, permitindo que outras ideias e conjuntos de dados sejam integrados para desafiar o modelo a fazer novas descobertas.”