Premiul Lasker pentru Cercetare Medicală de Bază din acest an a fost acordat lui Demis Hassabis și John Jumper pentru contribuțiile lor la crearea sistemului de inteligență artificială AlphaFold, care prezice structura tridimensională a proteinelor pe baza secvenței de ordinul întâi a aminoacizilor.
Rezultatele lor rezolvă o problemă care a frământat mult timp comunitatea științifică și deschid calea pentru accelerarea cercetării în domeniul biomedical. Proteinele joacă un rol esențial în dezvoltarea bolilor: în boala Alzheimer, se pliază și se aglomerează; în cancer, funcția lor de reglare se pierde; în tulburările metabolice congenitale, acestea sunt disfuncționale; în fibroza chistică, acestea intră în spațiul greșit din celulă. Acestea sunt doar câteva dintre numeroasele mecanisme care cauzează boli. Modelele detaliate ale structurii proteinelor pot oferi configurații atomice, pot conduce la proiectarea sau selecția moleculelor cu afinitate ridicată și pot accelera descoperirea medicamentelor.
Structurile proteinelor sunt în general determinate prin cristalografie cu raze X, rezonanță magnetică nucleară și criomicroscopie electronică. Aceste metode sunt costisitoare și consumatoare de timp. Acest lucru are ca rezultat existența unor baze de date 3D cu structuri proteice cu doar aproximativ 200.000 de date structurale, în timp ce tehnologia de secvențiere a ADN-ului a produs peste 8 milioane de secvențe proteice. În anii 1960, Anfinsen și colab. au descoperit că secvența 1D de aminoacizi se poate plia spontan și repetabil într-o conformație tridimensională funcțională (Figura 1A) și că „șaperonele” moleculare pot accelera și facilita acest proces. Aceste observații duc la o provocare de 60 de ani în biologia moleculară: prezicerea structurii 3D a proteinelor din secvența 1D de aminoacizi. Odată cu succesul Proiectului Genomului Uman, capacitatea noastră de a obține secvențe 1D de aminoacizi s-a îmbunătățit considerabil, iar această provocare a devenit și mai urgentă.
Prezicerea structurilor proteinelor este dificilă din mai multe motive. În primul rând, toate pozițiile tridimensionale posibile ale fiecărui atom din fiecare aminoacid necesită multă explorare. În al doilea rând, proteinele utilizează la maximum complementaritatea din structura lor chimică pentru a configura eficient atomii. Deoarece proteinele au de obicei sute de „donori” de legături de hidrogen (de obicei oxigen) care ar trebui să fie aproape de „acceptor” de legături de hidrogen (de obicei azot legat de hidrogen), poate fi foarte dificil să se găsească conformații în care aproape fiecare donor să fie aproape de acceptor. În al treilea rând, există exemple limitate pentru antrenarea metodelor experimentale, așa că este necesar să se înțeleagă potențialele interacțiuni tridimensionale dintre aminoacizi pe baza secvențelor 1D folosind informații despre evoluția proteinelor relevante.
Fizica a fost utilizată pentru prima dată pentru a modela interacțiunea atomilor în căutarea celei mai bune conformații și a fost dezvoltată o metodă pentru a prezice structura proteinelor. Karplus, Levitt și Warshel au primit Premiul Nobel pentru Chimie în 2013 pentru munca lor privind simularea computațională a proteinelor. Cu toate acestea, metodele bazate pe fizică sunt costisitoare din punct de vedere computațional și necesită procesare aproximativă, astfel încât structurile tridimensionale precise nu pot fi prezise. O altă abordare „bazată pe cunoștințe” este utilizarea bazelor de date cu structuri și secvențe cunoscute pentru a antrena modele prin inteligență artificială și învățare automată (AI-ML). Hassabis și Jumper aplică elemente atât din fizică, cât și din AI-ML, dar inovația și saltul în performanță al abordării provin în principal din AI-ML. Cei doi cercetători au combinat în mod creativ baze de date publice mari cu resurse de calcul de nivel industrial pentru a crea AlphaFold.
Cum știm că au „rezolvat” puzzle-ul predicției structurale? În 1994, a fost înființată competiția Critical Assessment of Structure Prediction (CASP), care se întrunește la fiecare doi ani pentru a urmări progresul predicției structurale. Cercetătorii vor partaja secvența 1D a proteinei a cărei structură au rezolvat-o recent, dar ale cărei rezultate nu au fost încă publicate. Predictorul prezice structura tridimensională folosind această secvență 1D, iar evaluatorul judecă independent calitatea rezultatelor prezise, comparându-le cu structura tridimensională furnizată de experimentator (furnizată doar evaluatorului). CASP efectuează evaluări oarbe reale și înregistrează salturi periodice de performanță asociate cu inovația metodologică. La cea de-a 14-a Conferință CASP din 2020, rezultatele predicției AlphaFold au arătat un astfel de salt în performanță încât organizatorii au anunțat că problema predicției structurii 3D a fost rezolvată: acuratețea majorității predicțiilor a fost apropiată de cea a măsurătorilor experimentale.
Semnificația mai amplă este că munca lui Hassabis și Jumper demonstrează în mod convingător cum AI-ML ar putea transforma știința. Cercetările sale arată că AI-ML poate construi ipoteze științifice complexe din mai multe surse de date, că mecanismele de atenție (similare cu cele din ChatGPT) pot descoperi dependențe și corelații cheie în sursele de date și că AI-ML poate autoevalua calitatea rezultatelor sale. AI-ML este, în esență, o activitate științifică.
Data publicării: 23 septembrie 2023




