Explorando o potencial dos modelos generativos na química e biologia

Com o crescimento das capacidades dos modelos de IA generativa, é notável como esses modelos podem transformar simples sugestões de texto em imagens hiper-realistas e até mesmo em vídeos extensos.

Recentemente, a IA generativa mostrou potencial para ajudar químicos e biólogos a explorar moléculas estáticas, como proteínas e DNA. Modelos como o AlphaFold conseguem prever estruturas moleculares, acelerando a descoberta de medicamentos, enquanto ferramentas como a “RFdiffusion” ajudam no design de novas proteínas. No entanto, um desafio é que as moléculas estão em constante movimento, o que é crucial para modelar ao construir novas proteínas e medicamentos. Simular esses movimentos em um computador usando física — técnica conhecida como dinâmica molecular — pode ser muito caro, exigindo bilhões de etapas de tempo em supercomputadores.

MDGen: uma nova abordagem para simulação molecular

Como um passo em direção a simular esses comportamentos de forma mais eficiente, pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) do MIT e do Departamento de Matemática desenvolveram um modelo generativo que aprende com dados anteriores. O sistema, chamado MDGen, pode pegar um quadro de uma molécula 3D e simular o que acontecerá em seguida, conectando quadros separados e até preenchendo quadros ausentes. Essa ferramenta poderia ajudar químicos a projetar novas moléculas e estudar de perto como seus protótipos de medicamentos interagiriam com a estrutura molecular que pretendem impactar.

Bowen Jing, coautor principal, afirma que o MDGen é uma prova de conceito inicial, mas sugere o início de uma nova direção de pesquisa empolgante. Jing compara o avanço aos modelos de IA generativa que inicialmente produziam vídeos simples, mas agora evoluíram para aplicações mais sofisticadas.

MDGen e suas aplicações potenciais

Os pesquisadores afirmam que o MDGen representa uma mudança de paradigma em relação aos trabalhos anteriores com IA generativa, permitindo casos de uso muito mais amplos. Abordagens anteriores eram “autoregressivas”, dependendo do quadro anterior para construir o próximo. Em contraste, o MDGen gera os quadros em paralelo com difusão, podendo conectar quadros nos pontos finais ou “aumentar” a taxa de quadros de uma trajetória.

Este trabalho foi apresentado em um artigo na Conferência sobre Sistemas de Processamento de Informação Neural (NeurIPS) em dezembro passado e foi premiado por seu potencial impacto comercial na Conferência Internacional sobre Aprendizado de Máquina.

Progresso na dinâmica molecular

Em experimentos, Jing e seus colegas descobriram que as simulações do MDGen eram semelhantes às simulações físicas diretas, produzindo trajetórias 10 a 100 vezes mais rápido. O sistema competiu com a precisão de um modelo de base, completando o processo de geração de vídeo em cerca de um minuto, uma fração das três horas que o modelo de base necessitava.

O MDGen também modelou passos intermediários quando fornecido com o primeiro e último quadro de uma sequência, demonstrando realismo em previsões diferentes. As capacidades do MDGen incluem simular quadros dentro de quadros, capturando fenômenos moleculares mais rápidos.

Próximos passos e desafios

Jing e o coautor Hannes Stärk reconhecem que o MDGen está no início do progresso para gerar dinâmicas moleculares de forma eficiente e ainda falta dados para tornar esses modelos imediatamente impactantes no design de medicamentos ou moléculas.

Os pesquisadores pretendem expandir o MDGen de modelagem de moléculas para prever como proteínas mudam ao longo do tempo, desenvolvendo métodos que acelerem o processo de coleta de dados para seu modelo.

Por ora, o MDGen apresenta um caminho promissor para modelar mudanças moleculares invisíveis a olho nu, oferecendo a químicos a possibilidade de investigar o comportamento de protótipos de medicamentos.

Bonnie Berger, professor do MIT, destaca que métodos de aprendizado de máquina que aprendem com simulações físicas representam uma nova fronteira na IA para a ciência. O MDGen é um framework de modelagem versátil que conecta esses dois domínios.

Pesquisadores da bioinformática reconheceram o sistema por sua capacidade de simular transformações moleculares, permitindo casos de uso inovadores como a amostragem de caminhos de transição.

Share:

administrator

Especialista em IA, inovação e estratégia de negócios. Founder Abre.bio, Co-Founder Growby.ai. Transformando tecnologia em impacto real. 🚀