Estruturas genômicas em 3D e expressão gênica

Cada célula do seu corpo contém a mesma sequência genética, mas apenas um subconjunto desses genes é expresso em cada célula. Esses padrões de expressão gênica específicos das células, que garantem que uma célula cerebral seja diferente de uma célula da pele, são parcialmente determinados pela estrutura tridimensional do material genético, que controla a acessibilidade de cada gene.

Químicos do MIT desenvolveram agora uma nova maneira de determinar essas estruturas genômicas em 3D, usando inteligência artificial generativa. Sua técnica pode prever milhares de estruturas em poucos minutos, tornando-a muito mais rápida do que os métodos experimentais existentes para analisar as estruturas.

Avanços na predição de estruturas genômicas

Usando essa técnica, os pesquisadores podem estudar mais facilmente como a organização 3D do genoma afeta os padrões de expressão gênica e as funções das células individuais. “Nosso objetivo era tentar prever a estrutura do genoma tridimensional a partir da sequência de DNA subjacente”, diz Bin Zhang, professor associado de química e autor sênior do estudo. “Agora que podemos fazer isso, o que coloca essa técnica no mesmo nível das técnicas experimentais de ponta, ela pode realmente abrir muitas oportunidades interessantes.”

Os estudantes de pós-graduação do MIT Greg Schuette e Zhuohan Lao são os principais autores do artigo, que aparece hoje na Science Advances.

Do DNA à estrutura

Dentro do núcleo celular, o DNA e as proteínas formam um complexo chamado cromatina, que possui vários níveis de organização, permitindo que as células comprimam 2 metros de DNA em um núcleo que tem apenas um centésimo de milímetro de diâmetro. Longas cadeias de DNA se enrolam em torno de proteínas chamadas histonas, gerando uma estrutura semelhante a contas em um fio.

Modificações epigenéticas, conhecidas como tags químicas, podem ser anexadas ao DNA em locais específicos, e essas tags, que variam de acordo com o tipo de célula, afetam a dobra da cromatina e a acessibilidade dos genes próximos. Essas diferenças na conformação da cromatina ajudam a determinar quais genes são expressos em diferentes tipos de células ou em momentos diferentes dentro de uma mesma célula.

Superando limitações com IA generativa

Para superar as limitações dos métodos experimentais tradicionais, Zhang e seus alunos desenvolveram um modelo que aproveita os avanços recentes em IA generativa para criar uma maneira rápida e precisa de prever estruturas de cromatina em células individuais. O modelo de IA que eles projetaram pode analisar rapidamente sequências de DNA e prever as estruturas de cromatina que essas sequências podem produzir em uma célula.

O modelo, chamado ChromoGen, possui dois componentes principais. O primeiro é um modelo de aprendizado profundo treinado para “ler” o genoma, analisando as informações codificadas na sequência de DNA subjacente e nos dados de acessibilidade da cromatina, que são amplamente disponíveis e específicos para cada tipo celular. O segundo componente é um modelo de IA generativa que prevê conformações de cromatina fisicamente precisas, tendo sido treinado com mais de 11 milhões de conformações de cromatina.

Análise rápida e precisa

Uma vez treinado, o modelo pode gerar previsões em um tempo muito mais rápido do que as técnicas experimentais como o Hi-C. “Você pode gerar mil estruturas em uma região específica com nosso modelo em 20 minutos usando apenas uma GPU”, afirma Schuette.

Após treinar seu modelo, os pesquisadores o usaram para gerar previsões de estrutura para mais de 2.000 sequências de DNA e compararam-nas com as estruturas determinadas experimentalmente para essas sequências. Eles descobriram que as estruturas geradas pelo modelo eram iguais ou muito semelhantes às vistas nos dados experimentais.

O modelo também conseguiu fazer previsões precisas para dados de tipos celulares diferentes daquele em que foi treinado, sugerindo que ele pode ser útil para analisar como as estruturas de cromatina diferem entre tipos celulares e como essas diferenças afetam sua função.

Aplicações futuras

ChromoGen oferece uma nova estrutura para a descoberta impulsionada por IA dos princípios de dobramento do genoma e demonstra que a IA generativa pode conectar características genômicas e epigenômicas à estrutura do genoma em 3D. Uma aplicação possível seria explorar como mutações em uma sequência de DNA específica alteram a conformação da cromatina, o que poderia esclarecer como tais mutações podem causar doenças.

“Há muitas perguntas interessantes que acho que podemos abordar com esse tipo de modelo”, diz Zhang. Os pesquisadores disponibilizaram todos os seus dados e o modelo para outros que desejem utilizá-los.

A pesquisa foi financiada pelo National Institutes of Health.

Share:

administrator

Especialista em IA, inovação e estratégia de negócios. Founder Abre.bio, Co-Founder Growby.ai. Transformando tecnologia em impacto real. 🚀