Vytvořte si AI tutoriál na míru! Vyzkoušejte generátor tutoriálů a ušetřete čas.

Potřebujete výzkumnou hypotézu? Zeptejte se umělé inteligence.

Sdílet na sociálních sítích:
Napsal: Jan Kubice
Věda

Inženýři MIT vyvinuli AI framework pro identifikaci hypotéz řízených důkazy pro vývoj bioinspirovaných materiálů.

Obrázek novinky

Potřebujete výzkumnou hypotézu? Zeptejte se umělé inteligence.

Vytvoření jedinečné a slibné výzkumné hypotézy je pro každého vědce základní dovedností. Může to být také časově náročné: Nové doktorandy mohou strávit první rok svého studia snahou rozhodnout se, co přesně prozkoumat ve svých experimentech. Co kdyby umělá inteligence mohla pomoci?

Výzkumníci z MIT vytvořili metodu pro autonomní generování a vyhodnocování slibných výzkumných hypotéz napříč obory prostřednictvím lidsko-AI spolupráce. V novém článku popisují, jak tento rámec použili k vytvoření hypotéz řízených důkazy, které jsou v souladu s neuspokojenými výzkumnými potřebami v oblasti bioinspirovaných materiálů.

Studie, publikovaná ve středu v časopise Advanced Materials, byla napsána Alirezou Ghafarollahim, postdoktorandem v Laboratoři pro atomistickou a molekulární mechaniku (LAMM), a Markusem Buehlerem, profesorem Jerry McAfee v inženýrství na katedrách stavebního a environmentálního inženýrství a strojírenství MIT a ředitelem LAMM.

Rámec, který výzkumníci nazývají SciAgents, se skládá z několika AI agentů, z nichž každý má specifické schopnosti a přístup k datům, které využívají metody „grafu uvažování“, kde AI modely využívají znalostní graf, který organizuje a definuje vztahy mezi různými vědeckými koncepty. Více-agentový přístup napodobuje způsob, jakým se biologické systémy organizují jako skupiny elementárních stavebních bloků. Buehler poznamenává, že tento princip „rozděl a panuj“ je prominentním paradigmatem v biologii na mnoha úrovních, od materiálů přes roje hmyzu až po civilizace – vše jsou příklady, kde je celková inteligence mnohem větší než součet schopností jednotlivce.

„Použitím více AI agentů se snažíme simulovat proces, kterým komunity vědců činí objevy,“ říká Buehler. „Na MIT to děláme tak, že máme skupinu lidí s různými profesními zkušenostmi, kteří spolu pracují a potkávají se v kavárnách nebo v nekonečné chodbě MIT. To je ale velmi náhodné a pomalé. Naším úkolem je simulovat proces objevování zkoumáním, zda mohou být AI systémy kreativní a dělat objevy.“

Automatizace dobrých nápadů

Jak ukázaly nedávné vývoj, velké jazykové modely (LLM) prokázaly úžasnou schopnost odpovídat na otázky, shrnovat informace a provádět jednoduché úkoly. Jsou však poměrně omezené, pokud jde o generování nových nápadů od nuly. Výzkumníci z MIT chtěli navrhnout systém, který umožní AI modelům provádět složitější vícestupňový proces, který přesahuje pouhé vybavení informací naučených během tréninku, aby extrapolovaly a vytvářely nové znalosti.

Základem jejich přístupu je ontologický znalostní graf, který organizuje a vytváří propojení mezi různými vědeckými koncepty. Pro vytvoření grafů výzkumníci zadají sadu vědeckých prací do generativního AI modelu. V předchozí práci Buehler použil oblast matematiky známou jako teorie kategorií, aby pomohl AI modelu vyvinout abstrakce vědeckých konceptů jako grafy, zakořeněné v definování vztahů mezi komponentami, způsobem, který by mohl být analyzován jinými modely prostřednictvím procesu zvaného uvažování grafu. To zaměřuje AI modely na rozvoj principiálnějšího způsobu porozumění konceptům; také jim umožňuje lépe zobecňovat napříč doménami.

„To je pro nás opravdu důležité pro vytvoření vědecky zaměřených AI modelů, protože vědecké teorie jsou typicky zakořeněny v zobecnitelných principech spíše než v pouhém zapamatování si znalostí,“ říká Buehler. „Zaměřením AI modelů na „myšlení“ tímto způsobem můžeme překonat konvenční metody a zkoumat kreativnější využití AI.“

Pro nejnovější článek výzkumníci použili asi 1 000 vědeckých studií o biologických materiálech, ale Buehler říká, že znalostní grafy by mohly být generovány pomocí mnohem více nebo méně výzkumných prací z jakéhokoli oboru.

Po vytvoření grafu výzkumníci vyvinuli AI systém pro vědecké objevování s několika modely specializovanými na plnění specifických rolí v systému. Většina komponent byla postavena na modelech řady OpenAI ChatGPT-4 a využívala techniku ​​známou jako učení v kontextu, ve které výzvy poskytují kontextové informace o roli modelu v systému a zároveň mu umožňují učit se z poskytnutých dat.

Jednotliví agenti v rámci spolupracují na kolektivním řešení komplexního problému, který by žádný z nich nedokázal vyřešit sám. Prvním úkolem, který dostanou, je generování výzkumné hypotézy. Interakce LLM začínají po definování podgrafu ze znalostního grafu, což se může stát náhodně nebo ručním zadáním páru klíčových slov probíraných v článcích.

V rámci má jazykový model, který výzkumníci pojmenovali „Ontolog“, za úkol definovat vědecké termíny v článcích a zkoumat propojení mezi nimi, doplňovat znalostní graf. Model s názvem „Vědec 1“ poté vytvoří výzkumný návrh na základě faktorů, jako je jeho schopnost odhalovat neočekávané vlastnosti a novosti. Návrh zahrnuje diskusi o potenciálních zjištěních, dopadu výzkumu a odhad základních mechanismů účinku. Model „Vědec 2“ rozšiřuje myšlenku, navrhuje specifické experimentální a simulační přístupy a provádí další zlepšení. Nakonec model „Kritik“ zdůrazňuje jeho silné a slabé stránky a navrhuje další vylepšení.

„Jde o to vybudovat tým expertů, kteří všichni nemyslí stejně,“ říká Buehler. „Musejí myslet jinak a mít různé schopnosti. Agent Kritik je záměrně naprogramován tak, aby kritizoval ostatní, takže nemáte každého, kdo souhlasí a říká, že je to skvělý nápad. Máte agenta, který říká: „Je zde slabost, můžete to lépe vysvětlit?“ To dělá výstup mnohem odlišným od jednotlivých modelů.“

Další agenti v systému jsou schopni prohledávat existující literaturu, což systému umožňuje nejen posoudit proveditelnost, ale také vytvořit a posoudit novost každého nápadu.

Posilování systému

Pro ověření svého přístupu Buehler a Ghafarollahi vytvořili znalostní graf na základě slov „hedvábí“ a „energeticky náročné“. Pomocí tohoto rámce model „Vědec 1“ navrhl integraci hedvábí s pigmentami na bázi pampelišky za účelem vytvoření biomateriálů se zlepšenými optickými a mechanickými vlastnostmi. Model předpověděl, že materiál bude výrazně pevnější než tradiční hedvábné materiály a bude vyžadovat méně energie na zpracování.

Vědec 2 poté učinil návrhy, například použití specifických nástrojů pro molekulární dynamickou simulaci k prozkoumání toho, jak by navrhované materiály interagovaly, a dodal, že dobrou aplikací pro materiál by byla bioinspirovaná lepidla. Model Kritik poté zdůraznil několik silných stránek navrhovaného materiálu a oblastí pro zlepšení, jako je jeho škálovatelnost, dlouhodobá stabilita a environmentální dopady používání rozpouštědel. Pro řešení těchto problémů Kritik navrhl provedení pilotních studií pro ověření procesu a provedení důkladných analýz odolnosti materiálu.

Výzkumníci také provedli další experimenty s náhodně vybranými klíčovými slovy, které přinesly různé originální hypotézy o efektivnějších biomimetických mikrofluidních čipech, zlepšení mechanických vlastností kolagenových lešení a interakci mezi grafenem a amyloidními fibrilami za účelem vytvoření bioelektronických zařízení.

„Systém dokázal přijít s těmito novými, důkladnými nápady na základě cesty ze znalostního grafu,“ říká Ghafarollahi. „Pokud jde o novost a použitelnost, materiály se zdály robustní a nové. V budoucí práci budeme generovat tisíce, nebo desetitisíce nových výzkumných nápadů a poté je můžeme kategorizovat, snažit se lépe pochopit, jak jsou tyto materiály generovány a jak by se daly dále zlepšit.“

V budoucnu výzkumníci doufají, že do svých rámců začlení nové nástroje pro načítání informací a spouštění simulací. Mohou také snadno vyměnit základní modely ve svých rámcích za pokročilejší modely, čímž umožní systému přizpůsobit se nejnovějším inovacím v oblasti AI.

„Díky způsobu, jakým tito agenti interagují, má zlepšení v jednom modelu, i když je malé, obrovský dopad na celkové chování a výstup systému,“ říká Buehler.

Od vydání preprintové verze s open-source detaily svého přístupu kontaktovaly výzkumníky stovky lidí, kteří se zajímají o použití rámců v různých vědeckých oborech a dokonce i v oblastech jako finance a kybernetická bezpečnost.

„Je mnoho věcí, které můžete dělat bez toho, abyste museli chodit do laboratoře,“ říká Buehler. „Do laboratoře chcete jít v podstatě až na samém konci procesu. Laboratoř je drahá a trvá dlouho, takže chcete systém, který dokáže velmi podrobně prozkoumat nejlepší nápady, formulovat nejlepší hypotézy a přesně předvídat emergentní chování. Naším cílem je to usnadnit, abyste mohli použít aplikaci k přidání dalších nápadů nebo přetažení datových sad, abyste skutečně vyzvali model k vytváření nových objevů.“

Související články

Sdílet na sociálních sítích:

Komentáře

Zatím žádné komentáře. Buďte první, kdo napíše svůj názor!