Vytvořte si AI tutoriál na míru! Vyzkoušejte generátor tutoriálů a ušetřete čas.

Chemici z MIT pomocí generativní AI rychle vypočítávají 3D genomické struktury

Sdílet na sociálních sítích:
Napsal: Jan Kubice
Věda

Nová metoda využívající umělou inteligenci předpovídá 3D strukturu DNA v buněčném jádru za minuty, nikoliv dny.

Obrázek novinky

Chemici z MIT pomocí generativní AI rychle vypočítávají 3D genomické struktury

Každá buňka v lidském těle obsahuje stejnou genetickou sekvenci, přesto každá buňka exprimuje pouze podmnožinu těchto genů. Tyto buněčně specifické vzorce exprese genů, které zajišťují, že se mozková buňka liší od kožní buňky, jsou částečně určeny trojrozměrnou strukturou genetického materiálu, která řídí přístupnost každého genu.

Chemici z MIT nyní přišli s novým způsobem, jak tyto 3D genomické struktury určit, a to pomocí generativní umělé inteligence. Jejich technika dokáže předpovědět tisíce struktur za pouhé minuty, čímž je mnohem rychlejší než stávající experimentální metody pro analýzu struktur.

Pomocí této techniky by výzkumníci mohli snadněji studovat, jak 3D organizace genomu ovlivňuje vzorce exprese genů a funkce jednotlivých buněk.

„Naším cílem bylo pokusit se předpovědět trojrozměrnou genomickou strukturu z podkladové DNA sekvence,“ říká Bin Zhang, docent chemie a hlavní autor studie. „Nyní, když to dokážeme, čímž se tato technika vyrovná špičkovým experimentálním technikám, může to skutečně otevřít mnoho zajímavých příležitostí.“

Hlavními autory článku, který vyšel dnes v časopise Science Advances, jsou absolventi MIT Greg Schuette a Zhuohan Lao.

Od sekvence ke struktuře

Uvnitř buněčného jádra tvoří DNA a proteiny komplex zvaný chromatin, který má několik úrovní organizace, což umožňuje buňkám vtěsnat 2 metry DNA do jádra, které má průměr pouhé setiny milimetru. Dlouhé řetězce DNA se ovíjejí kolem proteinů zvaných histony, čímž vzniká struktura podobná korálkům na niti.

Na DNA se na specifických místech mohou připojit chemické značky známé jako epigenetické modifikace. Tyto značky, které se liší podle typu buňky, ovlivňují skládání chromatinu a přístupnost blízkých genů. Tyto rozdíly v konformaci chromatinu pomáhají určit, které geny se exprimují v různých typech buněk nebo v různých časech v rámci dané buňky.

V posledních 20 letech vědci vyvinuli experimentální techniky pro stanovení struktur chromatinu. Jedna široce používaná technika, známá jako Hi-C, spojuje sousední řetězce DNA v buněčném jádru. Výzkumníci pak mohou zjistit, které segmenty jsou blízko sebe, rozdrcením DNA na mnoho malých kousků a jejich sekvenováním.

Tato metoda se může použít na velké populace buněk k výpočtu průměrné struktury pro úsek chromatinu, nebo na jednotlivé buňky k určení struktur v rámci této specifické buňky. Hi-C a podobné techniky jsou však náročné na práci a generování dat z jedné buňky může trvat asi týden.

Aby překonali tato omezení, Zhang a jeho studenti vyvinuli model, který využívá nedávný pokrok v generativní umělé inteligenci k vytvoření rychlého a přesného způsobu predikce struktur chromatinu v jednotlivých buňkách. Navržený model umělé inteligence dokáže rychle analyzovat DNA sekvence a předpovídat struktury chromatinu, které by tyto sekvence mohly v buňce vytvořit.

„Hluboké učení je skutečně dobré v rozpoznávání vzorů,“ říká Zhang. „Umožňuje nám analyzovat velmi dlouhé segmenty DNA, tisíce párů bází, a zjistit, jaké jsou důležité informace zakódované v těchto párech bází DNA.“

ChromoGen, model, který výzkumníci vytvořili, má dvě složky. První složka, model hlubokého učení naučený „číst“ genom, analyzuje informace zakódované v podkladové DNA sekvenci a datech o přístupnosti chromatinu, které jsou široce dostupné a specifické pro typ buňky.

Druhou složkou je generativní model AI, který předpovídá fyzikálně přesné konformace chromatinu, a to po proškolení na více než 11 milionech konformací chromatinu. Tato data byla generována z experimentů s použitím Dip-C (varianty Hi-C) na 16 buňkách z linie lidských B lymfocytů.

Po integraci první složka informuje generativní model o tom, jak buněčně specifické prostředí ovlivňuje tvorbu různých struktur chromatinu, a tento systém efektivně zachycuje vztahy mezi sekvencí a strukturou. Pro každou sekvenci výzkumníci používají svůj model k generování mnoha možných struktur. Je to proto, že DNA je velmi neuspořádaná molekula, takže jedna DNA sekvence může vést k mnoha různým možným konformacím.

„Hlavním komplikujícím faktorem při předpovídání struktury genomu je, že nemíříme na jediné řešení. Existuje rozložení struktur, bez ohledu na to, na jakou část genomu se díváme. Předpovídání tohoto velmi složitého, vícerozměrného statistického rozdělení je něco, co je neuvěřitelně náročné,“ říká Schuette.

Rychlá analýza

Po proškolení může model generovat predikce mnohem rychleji než Hi-C nebo jiné experimentální techniky.

„Zatímco můžete strávit šest měsíců prováděním experimentů, abyste získali několik desítek struktur v daném typu buňky, můžete pomocí našeho modelu vygenerovat tisíc struktur v dané oblasti za 20 minut pouze na jedné grafické kartě GPU,“ říká Schuette.

Po proškolení svého modelu jej výzkumníci použili k generování predikcí struktury pro více než 2 000 DNA sekvencí a poté je porovnali s experimentálně určenými strukturami pro tyto sekvence. Zjistili, že struktury generované modelem byly stejné nebo velmi podobné těm, které byly vidět v experimentálních datech.

„Obvykle se díváme na stovky nebo tisíce konformací pro každou sekvenci, a to vám dává rozumnou reprezentaci rozmanitosti struktur, které daná oblast může mít,“ říká Zhang. „Pokud svůj experiment opakujete několikrát, v různých buňkách, s velmi vysokou pravděpodobností skončíte s velmi odlišnou konformací. To se náš model snaží předpovědět.“

Výzkumníci také zjistili, že model může provádět přesné predikce pro data z jiných typů buněk, než na kterých byl trénován. To naznačuje, že model by mohl být užitečný pro analýzu toho, jak se struktury chromatinu liší mezi typy buněk a jak tyto rozdíly ovlivňují jejich funkci. Model by se také mohl použít k prozkoumání různých stavů chromatinu, které mohou existovat v jedné buňce, a jak tyto změny ovlivňují expresi genů.

Další možnou aplikací by bylo prozkoumat, jak mutace v konkrétní DNA sekvenci mění konformaci chromatinu, což by mohlo objasnit, jak takové mutace mohou způsobovat onemocnění.

„Existuje mnoho zajímavých otázek, které si myslím, že můžeme řešit pomocí tohoto typu modelu,“ říká Zhang.

Výzkumníci zpřístupnili všechna svá data a model ostatním, kteří je chtějí používat.

Výzkum byl financován Národními instituty zdraví.

Související články

Sdílet na sociálních sítích:

Komentáře

Zatím žádné komentáře. Buďte první, kdo napíše svůj názor!