janeiro 29, 2026
PTYANSVS6NDMXKPU56B5F6ENNU.jpg

Humanos e chimpanzés compartilham cerca de 98% de sua sequência de DNA, mas ninguém diria que são animais quase idênticos. Isto porque pequenas diferenças nas regiões reguladoras – por vezes apenas uma letra entre os 3 mil milhões que compõem o genoma humano – podem ter um impacto desproporcional sobre quando, onde e quantos genes são expressos e produzem características específicas da espécie ou levam ao cancro ou a problemas neurológicos.

A sequência do genoma humano foi concluída em 2003, e espalharam-se notícias dizendo que genes da felicidade, da homossexualidade ou que causavam certas doenças. Ou que nos sugeriram que apenas uma pequena percentagem separa os humanos dos outros animais. Costumava-se dizer que um gene continha instruções para uma célula produzir uma proteína, como reparar o tecido da pele, e que quando o processo dava errado, ocorriam problemas. Mas apesar da abundância de afirmações pomposas, já se sabia que a biologia não é um processo tão simples.

Além das partes do DNA que contêm as informações necessárias para formar os blocos de construção do nosso corpo, ou seja, as proteínas, há uma grande parte do genoma, erroneamente chamada de “DNA lixo”, que não codifica as proteínas, mas afeta o modo como elas são produzidas na parte do genoma que as codifica.

Mais de 98% das nossas variantes genéticas são assim e podem alterar o comportamento do genoma através de muitos mecanismos, e a mesma variante pode ter efeitos diferentes numa célula cerebral ou numa célula muscular. Compreender a complexidade destes efeitos é impossível sem computadores, e os cientistas da computação já estão oferecendo ferramentas para dar sentido ao que pode parecer uma confusão sem fim.

Esta quarta-feira, o Google DeepMind apresentou em artigo publicado na revista Naturezaseu modelo AlphaGenome, projetado para interpretar o genoma humano e, em particular, regiões não codificantes do DNA. “O Projeto Genoma Humano nos deu o livro da vida, mas lê-lo continua sendo um desafio. Temos o texto, mas ainda estamos decifrando a semântica”, disse Pushmit Kohli, vice-presidente de ciência do Google Deepmind e responsável pelo trabalho, apresentando os resultados.

O DNA é uma sopa de letrinhas com efeitos que podem ser dramáticos. Acredita-se, por exemplo, que a perda de um pedacinho de uma proteína composta por 24 letras químicas (GCAAGGACATATGGGCGAAGGAGA) pode alterar o desenvolvimento cerebral e contribuir para o desenvolvimento do autismo. Simplificando, o AlphaGenome atua como um intérprete universal dessa sopa de letrinhas do DNA. Você recebe um enorme pedaço de DNA, com um milhão de letras, e uma previsão letra por letra de sua função.

Pode, entre outras coisas, prever como os genes são expressos, como o DNA é organizado no espaço tridimensional (o que também tem implicações nos seus efeitos) ou como emendarum sistema de splicing que combina sequências de letras e permite que o mesmo gene produza leituras diferentes, e que está subjacente à capacidade das células de produzir proteínas diferentes com funções diferentes ou ao facto de existirem tantos seres vivos diferentes. Interpretar tudo sem a ajuda da IA ​​em grande escala é quase impossível.

Os modelos anteriores conseguiam prever um destes fenómenos, mas não todos, e enfrentavam um dilema. Aqueles que ofereciam resolução letra por letra só conseguiam analisar sequências curtas de cerca de 10.000 pares de letras. Isto significava, por exemplo, que não conseguiam ver a influência de regiões reguladoras distantes que actuam como interruptores genéticos a centenas de milhares de letras do gene que controlam. Por outro lado, os modelos que podiam lidar com centenas de milhares de bases não tinham a resolução necessária para ver os efeitos de letras individuais. Era como escolher entre olhar através de um telescópio ou usar uma lupa, mas o AlphaGenome tornou essa escolha desnecessária.

O artigo também comprovou sua capacidade de compreender doenças. Um exemplo é a leucemia linfoblástica tipo T. Nessa condição, não há mutações no gene TAL1, mas ele é dramaticamente ativado e causa câncer. Análise da única letra mutada na peça genoma lixoAlém do gene, eles foram capazes de prever como essa mutação ativaria o gene do tumor. O problema teria exigido meses de experimentação em laboratório, mas o AlphaGenome conseguiu simulá-lo e resolvê-lo em pouco tempo, demonstrando sua capacidade de identificar mecanismos patológicos ocultos.

Mafalda Díaz, pesquisadora do Centro de Regulação Genômica de Barcelona e uma das criadoras do modelo de inteligência artificial popEVE, disse que as capacidades combinadas de granularidade e processamento de um grande número de bases tornam o AlphaGenome “um passo muito emocionante como uma extensão do que a comunidade científica vem fazendo há algum tempo”. No entanto, ele alerta que “esses modelos não são altamente personalizáveis”. “Estes modelos são bons para compreender o que se passa com a biologia regulatória, mas não são bons para prever se uma variante terá impacto entre pessoas diferentes; têm utilidade clínica limitada”, acrescenta Diaz, que não esteve envolvido neste trabalho.

Os modelos predizem abstratamente o efeito molecular de uma variante, mas não podem prever a expressão genética específica de um indivíduo. Isso depende de todo o contexto genômico e ambiental, que vai além dos modelos. Hoje é mais utilizado para pesquisa básica do que para diagnóstico direto.

Žiga Avsek, responsável pelo desenvolvimento do modelo, admite que não resolveram “o problema de prever o efeito das variantes”. “Acho que ainda temos um longo caminho a percorrer”, diz ele. Embora um modelo possa prever como uma variante genética pode afectar processos moleculares, como a expressão genética, não pode prever de forma fiável e completa as consequências que a alteração de uma letra do ADN pode ter na realidade, numa célula ou tecido, e na saúde humana.

Embora o modelo “não seja perfeito porque a expressão genética é influenciada por fatores ambientais complexos que o modelo não consegue detectar, atingir o nível de precisão demonstrado é puramente baseado em regras”. sala O ADN é um feito técnico incrível”, disse Robert Goldstone, diretor de genómica do Instituto Francis Crick, em Londres, ao Science Media Center. Há investigadores que já veem o potencial destes modelos, por exemplo para o diagnóstico de doenças raras, e que já não devem procurar apenas o risco em genes específicos.

Natasha Latysheva, co-autora do estudo, explica que por enquanto os seus criadores vêem o AlphaGenome como uma ferramenta científica básica: “Vemos o AlphaGenome como uma ferramenta para compreender o que os elementos funcionais do genoma fazem, o que esperamos que acelere a nossa compreensão fundamental do código da vida”. O modelo está disponível para uso não comercial por pesquisadores.

Referência