RoseTTAFold napove strukturo beljakovin v 10 minutah

Novi algoritem, ki z veliko natančnostjo napove strukturo beljakovin v 10 minutah, je po novem prosto dostopen vsem. Gre za velik preboj, ki pomeni ogromen prihranek časa. Z običajnimi metodami namreč določanje struktur beljakovin traja mesece in celo leta.

3D model preproste beljakovine. Foto: Bigstock

RoseTTAFold je prosto dostopna metoda, ki so jo razvili na Medicinski fakulteti Univerze Washington. Gre za algoritem, ki uporablja globoko učenje za zelo natančno in hitro napovedovanje strukture beljakovin v primeru, ko je na razpolago zelo malo osnovnih podatkov.

Beljakovine ključne za vse procese v telesu

Beljakovine so sestavljene iz nizov aminokislin, ki se povežejo v izjemno zapletene oblike in so ključne za skoraj vsak biokemični proces v živih organizmih. Boljše razumevanje njihove strukture bo pospešilo razvoj novih načinov zdravljenja raka in številnih drugih kroničnih bolezni, so prepričani avtorji.

Beljakovine si lahko predstavljamo kot jezik, v katerem vse besede tvorimo iz končnega števila črk – pri nas 25. Pri beljakovinah vlogo črk prevzame 20 standardnih aminokislin plus vsaj še dve: selenocistein in pirolozin. Iz njih nastane nastane jezik, po katerem se ravna celotno naše telo. Pri sintezi (tvorbi) beljakovin ima ključno vlogo mRNK, ki služi kot neke vrste merilo, s pomočjo katerega se aminokisline povežejo v izjemno zapletene strukture.

Znanstveniki po vsem svetu so mesece čakali na dostop do zelo natančnega napovedovanja strukture beljakovin – potem, ko je algoritem DeepMind predstavil izjemen napredek na tem področju. Čakanja je zdaj konec. Raziskovalci na medicinski fakulteti Univerze Washington so v veliki meri poustvarili to, kar zmore DeepMind. Rezultate so 15. julija 2021 objavili v reviji Science. Povezavo do objave v celoti najdete spodaj.

Za razliko od DeepMind-a je RoseTTAFold prosto dostopen in se že množično uporablja za izdelavo beljakovinskih modelov v raziskovalne namene – vključno z razvojem novih zdravil. Samo v tednu dni je program iz GitHub-a preneslo več kot 140 neodvisnih raziskovalnih skupin.

Meseci laboratorijskega dela zgolj za eno beljakovino

“Kljub turbulentnemu letu zaradi pandemije smo uspeli razviti orodje za natančno napoved strukture beljakovin. Veseli me, da znanstvena skupnost RoseTTAFold že uporablja za reševanje zapletenih bioloških problemov, ” je povedal David Baker, profesor biokemije na Medicinski fakulteti Univerze v Washingtonu in direktor Inštituta za oblikovanje beljakovin. Skupina računalniških biologov je RoseTTAFold razvila prav pod njegovim vodstvom.

RoseTTAFold uporablja globoko učenje za hitro in natančno napovedovanje beljakovinskih struktur na podlagi le delnih informacij. Brez pomoči takšne programske opreme lahko traja mesece in celo leta, da se natančno določi struktura zgolj ene beljakovine. RoseTTAFold za to potrebuje 10 minut, pri čemer sploh ne potrebuje visoko zmogljivega računalnika. Dovolj je strojna oprema, kot je na primer potrebna za igranje računalniških iger.

Tritirna nevronska mreža se uči sama

Skupina je RoseTTAFold razvila na podlagi milijonov beljakovinskih struktur, vključno s številnimi slabo razumljenimi beljakovinami človeškega genoma. Za »učenje« algoritma so ustvarili tudi številne nove zapletene kombinacije aminokislin (ki sestavljajo beljakovine). Vključili so tudi strukture, ki so neposredno pomembne za zdravje ljudi – na primer beljakovin, ki so povezane s problematično presnovo lipidov, vnetji in rastjo rakavih celic. Izkazalo se je, da se RoseTTAFold lahko uporablja za izdelavo modelov kompleksnih bioloških sklopov, pri čemer porabi le delček časa, kot ga potrebujejo običajne metode.

RoseTTAFold je “tritirna” nevronska mreža, kar pomeni, da hkrati upošteva: 1. vzorce v zaporedjih beljakovin, 2. kako aminokisline beljakovin medsebojno delujejo in 3. možno tridimenzionalno strukturo beljakovin. V njej se enodimenzialne, dvodimenzionalne in tridimenzionalne informacije »pretakajo« naprej in nazaj – kar sistemu omogoča, da na podlagi omejenih informacij napove celotno beljakovino in njeno strukturo.

PUSTITE KOMENTAR

Prosimo vpišite svoj komentar!
Prosimo vpišite svoje ime tukaj