Vytvořte si AI tutoriál na míru! Vyzkoušejte generátor tutoriálů a ušetřete čas.

Nové výpočetní metody urychlují předpověď molekul a materiálů

Sdílet na sociálních sítích:
Napsal: Jan Kubice
Chemie

Výzkumníci z MIT vyvinuli novou neuronovou síť, která výrazně zrychluje a zpřesňuje předpovídání vlastností molekul a materiálů.

Obrázek novinky

Nové výpočetní metody urychlují předpověď molekul a materiálů

Dříve, v dávné minulosti, byl návrh nových materiálů nesmírně pracný. Po stovky let se vědci snažili vytvořit zlato kombinací olova, rtuti a síry v naději na nalezení správného poměru. I slavní vědci jako Tycho Brahe, Robert Boyle a Isaac Newton se pokoušeli o toto bezvýsledné úsilí, známé jako alchymie.

Věda o materiálech samozřejmě od té doby značně pokročila. Posledních 150 let vědci využívají periodickou tabulku prvků, která jim umožňuje pochopit různé vlastnosti jednotlivých prvků a nemožnost jejich magické přeměny. V posledním desetiletí navíc nástroje strojového učení značně zlepšily naši schopnost určovat strukturu a fyzikální vlastnosti různých molekul a látek. Nový výzkum skupiny vedené Ju Lim – profesorem jaderného inženýrství a materiálových věd a inženýrství na MIT – slibuje velký skok v možnostech, které mohou usnadnit návrh materiálů. Výsledky jejich výzkumu byly publikovány v prosincovém čísle časopisu Nature Computational Science (https://arxiv.org/abs/2405.12229).

V současné době většina modelů strojového učení používaných k charakterizaci molekulárních systémů vychází z teorie funkcionálu hustoty (DFT), která nabízí kvantově mechanický přístup k určení celkové energie molekuly nebo krystalu pomocí analýzy rozložení hustoty elektronů – v podstatě průměrného počtu elektronů nacházejících se v jednotkovém objemu v okolí daného bodu v prostoru blízko molekuly. (Walter Kohn, který tuto teorii před 60 lety spoluvyvinul, za ni v roce 1998 obdržel Nobelovu cenu za chemii.) Ačkoli je tato metoda velmi úspěšná, má podle Li některé nedostatky: „Za prvé, přesnost není jednotná. A za druhé, říká vám pouze jednu věc: nejnižší celkovou energii molekulárního systému.“

„Partnerská terapie“ na pomoc

Jeho tým nyní spoléhá na jinou výpočetní chemickou techniku, také odvozenou z kvantové mechaniky, známou jako teorie spojených klastrů, neboli CCSD(T). „Toto je zlatý standard kvantové chemie,“ komentuje Li. Výsledky výpočtů CCSD(T) jsou mnohem přesnější než výsledky výpočtů DFT a mohou být stejně důvěryhodné jako ty, které se v současnosti získávají z experimentů. Problém je v tom, že provádění těchto výpočtů na počítači je velmi pomalé, říká: „a škálování je špatné: Pokud zdvojnásobíte počet elektronů v systému, výpočty se stanou 100krát dražší.“ Z tohoto důvodu byly výpočty CCSD(T) obvykle omezeny na molekuly s malým počtem atomů – v řádu asi 10. Cokoliv nad to by prostě trvalo příliš dlouho.

Právě zde vstupuje do hry strojové učení. Výpočty CCSD(T) se nejprve provádějí na konvenčních počítačích a výsledky se poté použijí k trénování neuronové sítě s novou architekturou speciálně navrženou Lim a jeho kolegy. Po trénování dokáže neuronová síť provádět stejné výpočty mnohem rychleji díky využití aproximačních technik. Navíc jejich model neuronové sítě dokáže z molekuly extrahovat mnohem více informací než jen její energii. „V předchozí práci lidé používali několik různých modelů k posouzení různých vlastností,“ říká Hao Tang, doktorand materiálových věd a inženýrství na MIT. „Zde používáme pouze jeden model k vyhodnocení všech těchto vlastností, proto to nazýváme ‚multi-task‘ přístupem.“

„Multi-task Electronic Hamiltonian network“, neboli MEHnet, vrhá světlo na řadu elektronických vlastností, jako jsou dipólové a kvadrupólové momenty, elektronická polarizovatelnost a optická excitační mezera – množství energie potřebné k přenesení elektronu ze základního stavu do nejnižšího excitovaného stavu. „Excitační mezera ovlivňuje optické vlastnosti materiálů,“ vysvětluje Tang, „protože určuje frekvenci světla, které může molekula absorbovat.“ Další výhodou jejich modelu trénovaného na CCSD je, že dokáže odhalit vlastnosti nejen základních stavů, ale také excitovaných stavů. Model také dokáže předpovídat infračervené absorpční spektrum molekuly související s jejími vibračními vlastnostmi, kde jsou vibrace atomů v molekule spojeny navzájem, což vede k různým kolektivním chováním.

Síla jejich přístupu velmi závisí na architektuře sítě. Tým využívá takzvanou E(3)-ekvivariantní graf neuronovou síť, říká Tang, „ve které uzly reprezentují atomy a hrany, které spojují uzly, reprezentují vazby mezi atomy. Používáme také přizpůsobené algoritmy, které přímo do našeho modelu integrují fyzikální principy – související s tím, jak lidé vypočítávají molekulární vlastnosti v kvantové mechanice.“

Testování 1, 2, 3

Při testování na analýze známých uhlovodíkových molekul model Liho a spol. překonal protějšky DFT a úzce se shodoval s experimentálními výsledky získanými z publikované literatury.

Qiang Zhu – specialista na objevování materiálů na University of North Carolina v Charlotte (který nebyl součástí této studie) – je ohromen tím, čeho bylo dosud dosaženo. „Jejich metoda umožňuje efektivní trénování s malou datovou sadou, přičemž dosahuje vyšší přesnosti a výpočetní efektivity ve srovnání s existujícími modely,“ říká. „Jedná se o vzrušující práci, která ilustruje silnou synergii mezi výpočetní chemií a hlubokým učením, a nabízí nové nápady pro vývoj přesnějších a škálovatelných metod elektronové struktury.“

Skupina z MIT aplikovala svůj model nejprve na malé, nekovové prvky – vodík, uhlík, dusík, kyslík a fluor, ze kterých lze vyrábět organické sloučeniny – a od té doby přešla k zkoumání těžších prvků: křemík, fosfor, síra, chlor a dokonce i platina. Po proškolení na malých molekulách lze model zobecnit na stále větší a větší molekuly. „Dříve byly většinou výpočty omezeny na analýzu stovek atomů s DFT a pouhých desítek atomů s výpočty CCSD(T),“ říká Li. „Teď mluvíme o zpracování tisíců atomů a nakonec možná desítek tisíc.“

V současné době vědci stále vyhodnocují známé molekuly, ale model lze použít k charakterizaci molekul, které nebyly dosud viděny, a také k předpovědi vlastností hypotetických materiálů, které se skládají z různých druhů molekul. „Myšlenkou je použít naše teoretické nástroje k výběru slibných kandidátů, kteří splňují určitou sadu kritérií, než je navrhneme experimentátorovi k ověření,“ říká Tang.

Je to všechno o aplikacích

Zhu je optimistický ohledně možných aplikací. „Tento přístup má potenciál pro vysokorychlostní molekulární screening,“ říká. „To je úkol, kde dosažení chemické přesnosti může být nezbytné pro identifikaci nových molekul a materiálů s žádoucími vlastnostmi.“

Jakmile prokáží schopnost analyzovat velké molekuly s možná desítkami tisíců atomů, Li říká: „Měli bychom být schopni vynalézt nové polymery nebo materiály“, které by se mohly používat v návrhu léků nebo v polovodičových součástkách. Zkoumání těžších přechodných kovových prvků by mohlo vést k vzniku nových materiálů pro baterie – v současné době oblast akutní potřeby.

Budoucnost, jak ji Li vidí, je široce otevřená. „Už to není jen o jedné oblasti,“ říká. „Naším cílem je nakonec pokrýt celou periodickou tabulku s přesností na úrovni CCSD(T), ale s nižšími výpočetními náklady než DFT. To by nám mělo umožnit řešit širokou škálu problémů v chemii, biologii a materiálových vědách. Je těžké v současnosti říci, jak široká tato škála může být.“

Tato práce byla podpořena Honda Research Institute. Hao Tang děkuje za podporu od Mathworks Engineering Fellowship. Výpočty v této práci byly částečně provedeny na vysokorychlostním univerzálním atomickém simulátoru Matlantis, Texas Advanced Computing Center, MIT SuperCloud a National Energy Research Scientific Computing.

Související články

Sdílet na sociálních sítích:

Komentáře

Zatím žádné komentáře. Buďte první, kdo napíše svůj názor!