Představte si, že vaše DNA je jako obrovská knihovna plná písmenek, kde se skrývá spousta malých změn – takzvaných variant. Každý člověk jich má desítky tisíc, a většina z nich je neškodná, jako drobná tisková chyba v knize, která nic nezmění. Ale občas se objeví taková, co způsobí pořádný chaos, třeba vzácnou nemoc. Jak tyhle zlobivé varianty najít v tom obřím stohu? Tady přichází na scénu nový AI model jménem popEVE, který vyvinuli vědci z Harvard Medical School. Je to jako superdetektiv, co prohledává genom a říká: "Tahle varianta je nevinná, ale tahle by mohla způsobit opravdové problémy!"
Model popEVE dokáže pro každou variantu v genomu pacienta vypočítat skóre – takovou pravděpodobnost, že právě tahle změna způsobí nemoc. Není to jen černobílé rozhodnutí, jestli je varianta špatná nebo dobrá, ale spíš kontinuální škála, kde se varianty řadí od neškodných až po ty, co mohou vést k vážným onemocněním nebo dokonce smrti v dětství či dospělosti. Vědci to popsali v časopise Nature Genetics a ukázali, že popEVE našel více než 100 nových alterací zodpovědných za nediagnostikované vzácné genetické nemoci. To je jako najít ztracené poklady v genetickém moři!
Jak popEVE vznikl a co umí?
Všechno to začalo modelem EVE, který vymysleli v laboratoři Debory Marksové před několika lety. EVE se učí z hlubokých evolučních informací z různých druhů – bere si lekce z toho, jak se mutace chovají v přírodě napříč druhy. Ale EVE měl slabinku: nedokázal snadno porovnávat varianty mezi různými geny u lidí. Tak vědci, včetně Rose Orenbuchové, přidali do hry dvě nové věci. První je velký jazykový model pro proteiny (large-language protein model), který se učí z posloupností aminokyselin, co tvoří proteiny. Druhá je data z lidské populace, která zachycují přirozenou genetickou variabilitu.
Díky tomu popEVE nejen vidí, jak varianta ovlivní funkci proteinu, ale taky jak důležitá je pro celkové zdraví člověka. Debora Marks, profesorka systémové biologie v Blavatnik Institute na HMS, říká, že cílem bylo vytvořit model, který řadí varianty podle závažnosti nemoci a dává klinicky smysluplný pohled na genom pacienta. A víte co? Funguje to! Když ho testovali na známých variantách a případových studiích, popEVE úspěšně rozlišil mezi patogenními (nemoc způsobujícími) a benigními (neškodnými) variantami. Dokázal oddělit zdravé lidi od těch s těžkými vývojovými poruchami, určil, jestli varianta způsobí smrt v dětství nebo v dospělosti a dokonce poznal, jestli je varianta zděděná nebo náhodná – a to bez informací o rodičích.
Co je super, model nemá žádnou předpojatost vůči lidem z podreprezentovaných genetických skupin a nepřeceňuje počet patogenních variant. Rose Orenbuchová vysvětluje, že to kombinuje informace mezi druhy a uvnitř lidské populace, což dává jasný obrázek o vlivu varianty na fyziologii.
Odhalení nových genů díky PopEVE
Vědci vzali popEVE a aplikovali ho na skupinu asi 30 000 pacientů s těžkými vývojovými poruchami, kteří ještě neměli diagnózu. Tyto nemoci vypadaly geneticky, způsobené jednou variantou, ale tu variantu nikdo nenašel. PopEVE přinesl diagnózu v asi jedné třetině případů! A to nejlepší: identifikoval varianty na 123 genech spojených s vývojovými poruchami, které dřív nebyly známé. Z toho 25 genů mezitím potvrdily jiné laboratoře jako příčiny těchto poruch.
Teď se tým snaží dostat popEVE do praxe. Spolupracují s organizacemi jako Children’s Rare Disease Collaborative v Bostonské dětské nemocnici. Klinika v Centro Nacional de Análisis Genómico v Barceloně už popEVE používá k interpretaci variant u pacientů a pomohl k několika diagnózám vzácných nemocí.
Kam dál s popEVE?
Vědci teď integrují skóre z popEVE do databází jako ProtVar a UniProt, aby ho mohli používat vědci po celém světě. Model je dostupný online přes portál, kde si můžete prohlédnout varianty v grafech. Rose Orenbuchová je nadšená z potenciálu pro pacienty, kteří standardními metodami nedostali diagnózu – popEVE už našel spoustu kandidátních genů mimo známé nemocné geny.
Tenhle model by mohl nejen urychlit diagnózy, ale taky otevřít dveře k novým lékům tím, že ukáže, kde v genetice hledat cíle pro terapie.
