Inhibitori pentru proteaza noului coronavirus identificați prin screening-ul virtual a 687 de milioane de compuși
Andre Fischer, Manuel Sellner, Santhosh Neranjan, Markus A. Lill și Martin Smiesko
Farmacie computațională, Departamentul de științe farmaceutice, Universitatea din Basel
Rezumat
Epidemia rapidă a noului coronavirus al sindromului respirator acut sever 2 (SARS-CoV-2) în China, urmată de răspândirea sa în întreaga lume, reprezintă o preocupare globală serioasă pentru sănătatea publică, cu aproape 90000 de persoane infectate și mii de decese ( la data de 03.03.2020 cand a fost publicat articolul). Pentru a învinge infecțiile virale, inhibarea proteazelor esențiale pentru procesarea proteolitică a poliproteinelor virale reprezintă o strategie terapeutică convențională. Până în prezent, nu sunt disponibile medicamente sau vaccinuri specifice pentru tratarea SARS-CoV-2, în ciuda relației sale apropiate cu virusul SARS-CoV-1, care a provocat o epidemie similară în 2003. Astfel, rămâne o nevoie urgentă de dezvoltare a unor terapii antivirale specifice pentru a învinge SARS-CoV-2. Pentru a găsi noi inhibitori, am analizat computațional o bibliotecă de compuși de peste 687 de milioane de compuși pentru a determina legătura cu structura cristalină recent rezolvată a proteazei principale a SARS-CoV-2. Nu a mai fost raportat până acum un screening al unui spațiu chimic atât de vast pentru inhibitori ai proteazei SARS-CoV-2. După screening-ul formei, au fost aplicate două protocoale de docking, urmate de determinarea descriptorilor moleculari relevanți din punct de vedere farmacocinetic pentru a restrânge numărul de rezultate inițiale. În continuare, au fost efectuate simulări de dinamică moleculară pentru a valida stabilitatea modurilor de legare andocate și pentru a cuantifica în mod cuprinzător energiile de legare a ligandului. După evaluarea legăturii in afara tintei, raportăm o listă de 11 compuși asemănători unui medicament cu o energie liberă de legare îmbunătățită la proteaza țintă, spre deosebire de compusul peptidomimetic principal cocristalizat care suferă de proprietăți farmacocinetice slabe. În plus, am identificat un liant puternic cu proprietăți comparabile din biblioteca de compuși naturali.
Introducere
La sfârșitul anului 2019, un nou coronavirus, denumit coronavirusul 2 al sindromului respirator acut sever (SARS-CoV-2), a fost determinat ca fiind cauza mai multor de boli respiratorii în China.
Chiar dacă majoritatea pacienților infectați suferă doar de simptome ușoare, cum ar fi febra și tusea, asociate cu un prognostic bun, boala poate evolua în cazuri fatale de pneumonie și insuficiență respiratorie acută, în special la bărbații în vârstă cu comorbidități. Virusul s-a răspândit rapid din China în peste 55 de țări din întreaga lume și, până la această dată, a infectat aproape 90000 de persoane, provocând peste 2800 de decese (la 1 martie 2020), depășind deja epidemia de SARS-CoV-1 din 2003. Cel mai probabil, virusul își are originea într-o transmitere zoonotică între animale, cum ar fi liliecii și oameni, dar a progresat pentru a se transmite de la om la om prin infecția comună cu picături. Organizația Mondială a Sănătății a declarat epidemia de SARS-CoV-2 ca fiind o urgență de sănătate publică de interes internațional și, pe baza epidemiei de SARS-CoV-1 din 2003, va duce la pierderea multor vieți, având un impact social enorm și pierderi economice de miliarde de dolari. În prezent, nu sunt disponibile opțiuni terapeutice specifice pentru această infecție, ceea ce înseamnă că tratamentul clinic al bolii este în principal simptomatic, combinat cu o reutilizare a medicamentelor antivirale deja comercializate, cum ar fi ritonavirul, și a antibioticelor pentru tratarea infecțiilor secundare. Prin urmare, rămâne o nevoie urgentă de dezvoltare de terapii antivirale împotriva SARS-CoV-2.
Inhibarea proteazelor virale necesare pentru procesarea proteolitică a poliproteinelor a fost o strategie de succes în tratamentul farmacologic al virusului imunodeficienței umane (HIV) și respectiv al hepatitei C, dovedind potențialul inhibitorilor de protează pentru tratamentul infecțiilor virale. În mod similar, principala protează a SARS-CoV-2 este considerată a fi esențială pentru replicarea virală și, prin urmare, este considerată o țintă promițătoare pentru farmacoterapia antivirală. Structura cristalină a proteazei principale a SARS-CoV-2 a fost recent rezolvată, permițând proiectarea rațională a unor compuși inhibitori specifici. Relația strânsă dintre SARS-CoV-2 și SARS-CoV-1 este reflectată de identitatea de secvență ridicată de 96,1% între proteazele lor. În acest sens, s-a sugerat că medicamentele dezvoltate împotriva SARS-CoV-1 ar putea fi eficiente pentru tratarea SARS-CoV-2. Cu toate acestea, acești compuși au rămas în stadiul preclinic sau în stadiul clinic timpuriu, fără a conduce la un medicament aprobat, iar eficacitatea lor pentru noul virus ar putea fi cauzată de diferențele dintre anumiți aminoacizi. În consecință, dezvoltarea de inhibitori specifici pentru proteaza principală a SARS-CoV-2 rămâne o necesitate urgentă pentru comunitatea științifică, fapt reflectat de multiplele proiecte care se concentrează asupra acestei proteine. De exemplu, trei studii care investighează reconversia medicamentelor comercializate au propus mai mulți candidați pentru tratamentul SARS-CoV-2. Într-un alt studiu recent, o abordare de învățare profundă combinată cu un model de omologie a proteazei a fost aplicată pentru a examina o bibliotecă de aproximativ un milion de compuși, inclusiv medicamente deja aprobate, tripeptide și produse naturale. Cu toate acestea, dezavantajul aplicării unor produse terapeutice concepute inițial pentru o țintă diferită este riscul unor efecte farmacologice nedorite și al unor reacții adverse.
În acest studiu, am analizat o bibliotecă mare de peste 687 de milioane de compuși cu ambiția de a găsi noi inhibitori pentru proteaza principală a SARS-CoV-2. Într-o primă etapă, am efectuat un screening bazat pe formă cu lianți cunoscuți pentru proteaza principală a SARS-CoV-1 și substructuri relevante ca molecule șablon. După runda inițială de screening al formei, au fost aplicate două protocoale diferite de docking, urmate de evaluarea descriptorilor moleculari relevanți pentru farmacocinetică, pentru a reduce numărul de lianți. A fost aplicată gruparea bazată pe amprente moleculare pentru a asigura diversitatea structurală a compușilor care au fost, în etapa următoare, supuși simulărilor de dinamică moleculară (MD). Pe baza traiectoriilor obținute, energia liberă de legare a liganzilor a fost cuantificată cu ajutorul post-procesării Mecanică moleculară/Arie de suprafață Born generalizată (MM/GBSA). În ultima etapă, am evaluat potențialele efecte toxice ale compușilor din cauza interacțiunii cu 16 ținte secundare cunoscute ale medicamentelor, pentru a face o selecție finală de 11 compuși. O astfel de explorare cuprinzătoare a spațiului chimic cu scopul de a descoperi inhibitori ai proteazei SARS-CoV-2 nu a fost, după cunoștințele noastre, raportată anterior.
Rezultate și discuții
Comparația proteazelor între SARS-CoV-2 și SARS-CoV-1
Proteaza SARS-CoV-2 este formată din trei domenii (figura 1A) și procesează poliproteinele folosind o diadă catalitică formată din histidină și cisteină ca reziduuri catalitice. Situl său activ este situat între domeniile I și II. Deoarece SARS-CoV-2 este strâns înrudit cu SARS-CoV-1, proteazele lor prezintă un grad ridicat de similaritate de secvență (96,1 %; figura 1D). În vecinătatea sitului activ, doar un singur aminoacid (Ser46) diferă între cele două proteaze. Cu toate acestea, topologia de suprafață a sitului activ între cele două proteine prezintă diferențe distincte, în special în vecinătatea buclei centrate în jurul lui Asn142 (figurile 1B și 1C). În plus, dimensiunea și adâncimea buzunarului S1′ prezintă diferențe notabile și, în centrul S1, S1′ și S3, proteaza SARS-CoV-2 prezintă o subcavitate mai distinctă, spre deosebire de enzima SARS-CoV-1. În consecință, inhibitorii proteazei SARS ar putea prezenta afinități de legare modificate pentru proteaza SARS-CoV-2. Similitudinile cu alte proteaze virale, cum ar fi cea a HIV sau cea a coronavirusului sindromului respirator din Orientul Mijlociu (MERS-CoV), sunt relativ scăzute. Deși se presupune că principala protează este cea mai promițătoare țintă terapeutică pentru atenuarea replicării virale, a fost luată în considerare și inhibarea altor proteine funcționale, cum ar fi proteaza de tip papaină sau interacțiunea dintre proteina virală de tip spike și receptorul său de intrare în celulele umane.
Figura 1: Prezentare structurală și alinierea secvenței. (A) Sunt prezentate cele trei domenii (domeniul I în albastru, domeniul II în gri, domeniul III în roșu) ale proteazei principale a SARS-CoV-2.
Modificările de aminoacizi între SARS-CoV-1 și SARS-CoV-2 sunt indicate prin asteriscuri. Ligandul cocristalizat (PDB ID 6LU7) este prezentat în organe. (B) Topologia de suprafață a buzunarului de legare a proteazei principale SARS-CoV-2 (PDB ID 6LU7). Locația lui Ser46 este indicată printr-un asterisc. (C) Topologia de suprafață a buzunarului de legare a proteazei principale SARS-CoV-1 (PDB ID 2A5I). (D) Alinierea secvenței de proteaze ale SARS-CoV-1 și SARS-CoV-2. Neconcordanțele sunt marcate cu albastru.
Proceduri de screening virtual
Screeningul virtual este o tehnică utilizată pe scară largă în stadiul incipient al descoperirii de medicamente, care permite identificarea compușilor potențial bioactivi la un randament ridicat. Datorită vitezei și rentabilității sale, utilizarea acesteia pentru a identifica candidații medicamentoși împotriva SARS-CoV-2, care se extinde la nivel mondial, reprezintă o abordare promițătoare, în special atunci când timpul este esențial. Inhibarea proteazelor ca tratament împotriva infecțiilor virale a fost dovedită în cazul HIV, ceea ce face ca principala protează a SARS-CoV-2 să fie o țintă medicamentoasă atractivă, în special din moment ce structura sa cristalină a fost recent rezolvată. În cadrul fluxului nostru de lucru de screening virtual (figura 2), am început cu 687 de milioane de compuși din baza de date tridimensională ZINC într-o rutină de screening bazată pe formă. Un astfel de protocol grosier accelerat de GPU permite screening-ul rapid al unor baze de date mari, bazat pe lianți cunoscuți ca șablon. Eforturile anterioare de screening virtual au fost limitate la biblioteci de compuși semnificativ mai mici.
Figura 2: Fluxul de lucru al screening-ului virtual și pozițiile de legare a primilor doi liganzi. (A) Fluxul de lucru al screening-ului virtual. (B) Poziția de legare a CP-1. (C) Poziția de legare a CP-2.
Am redus numărul mare de rezultate inițiale (395132 de compuși) la 6599 de compuși prin selectarea celor mai bune rezultate în ceea ce privește suprapunerea formelor. Compușii rămași au fost andocați în situsul activ a cinci structuri reprezentative ale proteazei folosind protocolul de andocare smina, rezultând 2286 de rezultate pozitive cu un scor sub pragul de -7,0 kcal/mol, majoritatea compușilor având un scor sub -5,0 kcal/mol. În timp ce majoritatea studiilor anterioare privind SARS-CoV-2 s-au limitat la un model homologic al proteazei, noi ne-am putut baza pe o structură cristalină recent rezolvată pentru procedurile noastre de docking. Descriptorii farmacocinetici ai acestor compuși sunt prezentați în figura 3. Datorită provenienței compușilor selectați din baza de date ZINC, era de așteptat să existe o asemănare cu un medicament în ceea ce privește greutatea moleculară (MW). Cu toate acestea, mai multe structuri încalcă criteriile general acceptate coeficientul de distribuție logD și suprafața polară (PSA), permițând delimitarea lor. Datorită funcției catalitice a enzimei-țintă, peptidele și peptidomimeticele sunt aplicate pe scară largă în direcționarea proteazelor. Cu toate acestea, dezavantajele peptidelor sau ale peptidomimeticelor includ o biodisponibilitate orală limitată din cauza MW mare, PSA și a numărului mare de legături rotative, precum și o stabilitate metabolică slabă și costuri de producție mai mari. Prin urmare, dezvoltarea de molecule mici cu proprietăți farmacocinetice echilibrate și favorabile care să faciliteze absorbția orală oferă o alternativă promițătoare.
Figura 3: Descriptori relevanți din punct de vedere farmacocinetic ai compușilor care au fost supuși la protocolul de andocare Glide SP.
În încercarea de a ajunge la un consens în ceea ce privește afinitatea de legare, am utilizat protocolul Glide SP pentru a evalua interacțiunea celor 2286 de compuși rămași cu situsul activ al proteinei. Cu excepția a doi compuși, în toate cazurile a fost detectată o poziție de legare validă, majoritatea compușilor având scoruri sub -5,0 kcal/mol. Setul de compuși cu un scor Glide sub -6,5 kcal/mol a prezentat un număr mare de liganzi congenerici, inclusiv mulți compuși naturali asemănători din punct de vedere structural. Prin urmare, pentru a stimula diversitatea structurală a setului de compuși, am calculat amprente de conectivitate extinsă și le-am comparat în funcție de coeficientul Tanimoto pentru o grupare ulterioară. Pentru fiecare cluster, au fost selectați cei doi compuși cu cel mai bun scor Glide și au fost evaluați în ceea ce privește descriptorii farmacocinetici ai acestora. Nu am permis încălcarea nici a criteriilor Lipinski și Veber, rezultând 55 de compuși rămași pentru simularea MD. Pe baza ansamblului de complecși ligand-proteină cu evoluție în timp rezultat, energiile libere de legare ale liganzilor au fost estimate cu ajutorul protocolului MM/GBSA. Acest protocol a fost aplicat recent pentru a prezice energia de interacțiune dintre nelfinavir și proteaza principală SARS-CoV-2. Compușii cu o îmbunătățire a energiei libere de legare în contrast cu ligandul cocristalizat au fost luați în considerare în ceea ce privește potențiala lor toxicitate. VirtualToxLab evaluează potențialul toxic al unei molecule mici pe baza afinităților individuale de legare la 16 ținte externe validate, inclusiv receptori nucleari, enzime metabolice și canalul uman Ether-a-go-go-Related Gene (hERG). O astfel de evaluare într-un stadiu timpuriu al descoperirii de medicamente ar putea reduce rata de abandon a medicamentelor din cauza toxicității și siguranței, care reprezintă o mare parte din eșecurile preclinice și clinice ale programelor de dezvoltare a medicamentelor. Cei 17 compuși rămași au inclus mai mulți compuși cu un potențial toxic peste 0,5, care ar putea fi eliminați din setul final. Dintre liganzii supuși simulării MD, am selectat în continuare compusul natural cu cea mai mică energie liberă de legare, care a fost (-)-taxifolina.
Selecția finală a compusului
Am identificat 11 compuși cu o energie liberă de legare mai mică combinată cu un potențial teoretic mai mare de absorbție după administrarea orală în comparație cu ligandul cocristalizat N3 (tabelul 1 și figura 4).
Figura 4: Structuri ale selecției noastre finale de compuși și ale compusului natural cu cel mai mare punctaj.
Setul de liganzi raportat ar trebui să fie considerat drept compuși principali timpurii, deoarece nu a fost realizată nicio optimizare susținută experimental. În timp ce unii compuși au oferit doar o scădere minoră în ceea ce privește energia de legare, CP-1 până la CP-4 au prezentat o îmbunătățire substanțială în comparație cu ligandul cocristalizat, de până la aproape 30 %. Un studiu care a aplicat în primul rând inteligența artificială sub forma unei rețele neuronale pentru a descoperi inhibitori ai SARS-CoV-2 a testat în plus compusul lor folosind AutoDock Vina. Compușii lor prezintă scoruri de andocare cuprinse între -7,3 și -8,5 kcal/mol,12 ceea ce este comparabil cu selecția noastră de liganzi (Tabelul S1, Informații de sprijin). Antiviralele noastre propuse au interacționat cu ținta cu cel puțin o legătură de hidrogen, cu o medie de peste două (Figura 2A și 2B, Tabelul S2). Mai mult, aceștia au prezentat descriptori farmacocinetici excelenți cu valori logD cuprinse între 0 și 4,6, MW sub 487 g/mol, PSA sub 105,5 A2 și acceptori de legături de hidrogen, precum și donatori în intervalul descris de Lipinski. În consecință, compușii oferă un avantaj față de inhibitorii peptidomimetici descriși în mod obișnuit. Spre deosebire de alți inhibitori propuși pentru SARS-CoV-2, disponibilitatea compușilor este marcată ca fiind fie de vânzare, în stoc sau la cerere în baza de date ZINC (tabelul S1). În ceea ce privește toxicitatea potențială prin legare în afara țintei, compușii au prezentat în mod regulat potențiale toxice apropiate de 0,5. Primii doi compuși CP-1 și CP-2 au prezentat valori relativ scăzute și, prin urmare, reprezintă candidați excelenți pentru investigații suplimentare in vitro. În mod similar, compusul natural (-)-taxifolină a prezentat doar un potențial scăzut de legare la cele 16 ținte externe. Compușii naturali, cum ar fi avonoidele, au fost considerați anterior ca inhibând principala protează a SARS-CoV-1, iar eficacitatea lor a fost demonstrată prin transferul de energie prin rezonanță de fluorescență (FRET). Mai mult, experimentele in vivo cu (-)-taxifolina au evidențiat activitatea împotriva altor virusuri, cum ar fi coxsackievirus B4. Se știe că zada siberiana (Larix sibirica) produce (-)-taxifolină, oferind o resursă naturală pentru extracția acesteia. În plus, preparatele alimentare care conțin (-)-taxifolină sunt ușor de procurat din farmacii și alte companii, ceea ce permite accesul direct și rapid la acest potențial antiviral. În mod remarcabil, (-)-taxifolina are șapte legături de hidrogen, ceea ce reprezintă cel mai mare număr din selecția noastră de compuși. Deoarece legăturile de hidrogen sunt un factor determinant pentru specificitatea medicamentului, (-)-taxifolina ar putea oferi o alternativă naturală la inhibitorii propuși CP-1 la CP-11.
Concluzii
Epidemia de SARS-CoV-2 în întreaga lume și consecințele care au rezultat reprezintă un memento impresionant al amenințării pe care o reprezintă bolile zoonotice pentru sănătatea publică și economia multor țări. Lipsa unor terapii specifice împotriva acestui nou virus îndeamnă la descoperirea de noi compuși medicamentoși pentru care metodele computaționale oferă o abordare rapidă și eficientă din punct de vedere al costurilor. În acest caz, am utilizat un flux de lucru de screening virtual care constă în șapte etape individuale pentru a determina în cele din urmă 11 potențiali lianți. Pentru toți compușii raportați, am estimat o toxicitate scăzută până la moderată cauzată de legarea în afara țintei, o mai bună asemănare cu un medicament, precum și o mai bună legare la ținta terapeutică în comparație cu ligandul cocristalizat.
Tabelul 1: Selecția finală a compușilor în comparație cu ligandul cocristalizat și cu compusul natural cu cel mai mare punctaj.
În plus, raportăm un compus natural care apare în zada siberiana și care oferă o alternativă promițătoare la extractele de plante și suplimentele derivate disponibile în comerț. Până în prezent, studiul nostru marchează cel mai amplu screening computațional pentru descoperirea de inhibitori ai proteazei principale a SARS-CoV-2. Validarea experimentală și optimizarea ulterioară a compușilor noștri principali propuși ar putea oferi o strategie valoroasă pentru a învinge SARS-CoV-2.
Materiale și metode
Pregătirea sistemului și generarea ansamblului
Structura proteică a proteazei principale a SARS-CoV-2 a fost preluată din Protein Data Bank (PDB ID 6LU7) și prelucrată cu ajutorul programului Protein Preparation Wizard care este inclus în Maestro Small-Molecule Drug Discovery Suite (v2019-4)31 prin adăugarea de atomi de hidrogen, predicția stărilor de protonare la pH fiziologic (pH = 7,4) și reorientarea rețelei de legături de hidrogen. Alinierea secvenței la proteinaza SARS-CoV-1 a fost realizată utilizând suita de instrumente Ugene combinată cu algoritmul ClustalW. In continuare, sistemul a fost supus unei minimizări restrânse cu un prag de convergență de 0,3 A pentru deviația medie pătratică (RMSD) folosind câmpul de forță OPLS 2005. Pentru a obține un ansamblu de structuri pentru următoarele proceduri, s-a efectuat o simulare MD cu o durată de 20 ns utilizând motorul de simulare Desmond (v2019-1). Pentru a rezolva sistemele de limite periodice ortorombice care se extind la 10 A de la complex în fiecare dimensiune, am selectat modelul de apă TIP3P. În primul rând, a fost executat protocolul de relaxare implicit al Desmond, urmat de faza de producție la 310 K într-un ansamblu NPT. Pentru toate simulările de producție din acest studiu, am aplicat barostatul Martyna-Tobias-Klein, cu un timp de relaxare de 2,0 ps la 300 K și termostatul Nose-Hoover, cu un timp de relaxare de 1,0 ps. Am utilizat algoritmul u-series pentru a trata interacțiunile cu rază lungă de acțiune, cu o limită de 9 A pentru interacțiunile cu rază scurtă de acțiune și algoritmul M-SHAKE pentru a determina legăturile cu atomii de hidrogen. Pasul de timp al integratorului RESPA a fost lăsat la 2,0 fs, iar instantaneele cu coordonate atomice au fost salvate la un interval de 10 ps. Utilizând traiectoria de simulare rezultată, am folosit scriptul trj_cluster.py furnizat în Maestro, care se bazează pe un algoritm de propagare a afinității, pentru a determina cinci structuri reprezentative ale proteazei.
Descriptori farmacocinetici
Descriptorii chimici conform lui Lipinski și Veber, precum și solubilitatea apoasă (logS), despre care se știe că influențează farmacocinetica medicamentelor candidate, au fost determinați cu ajutorul modulului cxcalc din suita Marvin (v20.4.0). În loc de valoarea logP, utilizată în mod obișnuit, am decis să folosim valoarea logD, mai reprezentativă, pentru a prezice repartiția liganzilor în ceea ce privește stările de ionizare. Proprietățile care depind de ionizarea compusului au fost calculate la o valoare fiziologică a pH-ului de 7,4. Descriptorii au fost calculați pentru toți liganzii care au fost furnizați în protocolul de andocare smina.
Docking și screening de formă
Într-o primă etapă, protocolul de screening al formei accelerat de GPU al Maestro a fost utilizat pentru a compara rapid porțiunea asemănătoare unui medicament din biblioteca tridimensională ZINC. În plus, din cauza dimensiunii relativ mari a inhibitorului peptidomimetic cocristalizat, au fost luați în considerare compușii cu o greutate moleculară de peste 500 g/mol. Ca șabloane, au fost selectate o substructură a ligandului cocristalizat al proteazei SARS-CoV-2 (compusul 4), un ligand cocristalizat (compusul 9) și trei substructuri ale inhibitorilor echivalenți ai proteazei SARS-CoV-1 (compușii 1, 3 și 7), precum și patru inhibitori cunoscuți ai SARS-CoV-1 cu o afinitate de legare sub 10 µM (compușii 2, 5, 6 și 8) derivați din baza de date PubChem (cf. figura 2). Inhibitorii derivați experimental au fost selectați pe baza diversității lor structurale evaluate cu ajutorul amprentelor moleculare de conectivitate extinsă, urmate de o comparație Tanimoto și de o grupare ulterioară în panoul Discovery Informatics din cadrul Maestro. Pentru compararea formei, a fost selectat un prag de 45 % de suprapunere a formei. Cele mai bune 5 000 de rezultate pozitive în ceea ce privește similitudinea formei, precum și cei mai buni 500 de compuși din fiecare șablon de intrare au fost selectați pentru etapele următoare.
Figura 5: Structuri de intrare pentru screeningul formei derivate din structuri cristaline și din baza de date PubChem.
În continuare, am utilizat protocolul de andocare smina, o bifurcație a AutoDock Vina (v1.1.2), pe compușii selectați pentru a cuantifica interacțiunea acestora cu fiecare dintre structurile reprezentative din ansamblul generat. Fișierele PDBQT ale ligandului pentru andocare au fost generate cu ajutorul scriptului prepare_ligand4.py care vine cu AutoDockTools (v1.5.4). Docking-ul a fost efectuat la o exhaustivitate de 16, spațiul de căutare a fost denaturat utilizând metoda automată cu smina și a fost selectată o sămânță aleatorie de 42. Rezultatele cu o energie liberă de legare mai mică de -7,0 kcal/mol au fost apoi supuse protocolului de andocare standard de precizie (SP) Glide implicit în Maestro. De asemenea, a fost cuantificată interacțiunea cu toate cele cinci structuri de ansamblu. Compușii cu o energie liberă de legare mai mică de -6,5 kcal/mol au fost apoi supuși grupării pe baza comparației Tanimoto a amprentelor moleculare per atom. Pentru fiecare dintre cele 138 de clustere rezultate, cei mai buni doi compuși (un compus în cazul unei singure structuri pe cluster) în funcție de scorul Glide au fost selectați pentru o evaluare ulterioară. Disponibilitatea comercială a compușilor a fost preluată de pe site-ul web ZINC. Setul nal de compuși care a fost supus simulărilor MD a fost selectat în conformitate cu următoarele criterii: (i.) disponibilitate, (ii.) nicio încălcare a criteriilor Lipinski și Veber, (ii.) scor mediu al ansamblului sub -6,5 kcal/mol în docking smina, (iv.) scor mediu al ansamblului sub -6,0 kcal/mol în docking Glide SP și (v.) suma celor mai bune scoruri de docking în oricare dintre protocoale sub -14,5 kcal/mol. Aceeași procedură de andocare și clasificare a fost realizată cu ligandul cocristalizat N3.
Simulări MD și post-procesare
Pentru a înțelege mai bine stabilitatea și energiile de interacțiune ale setului de liganzi filtrați anterior, am efectuat simulări MD pentru fiecare compus. Ca intrare pentru simulări, am ales complexul ligand-proteină cu cel mai mare scor de andocare Glide SP dintre structurile din ansamblu. Durata simulărilor a fost selectată să fie de 25 ns, cu coordonate atomice înregistrate la un interval de 25 ps, în timp ce celelalte setări au fost lăsate așa cum au fost descrise mai sus.
Stabilitatea modurilor de legare a fost cuantificată utilizând RMSD în panoul Simulation Interaction Diagram (Diagrama de interacțiune a simulării) din Maestro. Energia liberă de legare a fost cuantificată utilizând rutina thermal_mmgbsa.py care vine cu Maestro pentru ultimele 100 de cadre ale traiectoriei cu o dimensiune a pasului de doi. Această rutină se bazează pe calculele MM/GBSA, care în esență compară stările apo și holo ale enzimei cu diverși termeni entalpici. Energiile libere de legare rezultate au fost mediate pentru cadrele selectate ale traiectoriilor.
Evaluarea toxicității și selectarea setului final de compuși
Efectele toxice potențiale ale compușilor care au fost supuși simulărilor MD au fost evaluate cu ajutorul VirtualToxLab, care evaluează afinitatea de legare a unui compus sondă la 16 ținte externe cunoscute. Structurile-țintă includ receptorul de androgeni (AR), receptorul de hidrocarburi arilice (AhR), citocromul P450 1A2 (CYP1A2), CYP2C9, CYP2D6, CYP3A4, receptorul estrogenic α (ERα), ERβ, receptorul glucocorticoid (GR), receptorul mineralocorticoid (MR), receptorul hepatic X (LXR), canalul hERG, receptorul activat de proliferatorul peroximei ϒ (PPAR ϒ), receptorul de progesteron (PR), receptorul tiroidian α (TRα) și TRβ. Rutina cuantifică afinitățile de legare la fiecare țintă și pe baza acestora, estimează o valoare numerică a toxicității denumită potențial toxic, variind între 0,0 și 1,0. Setul de liganzi supuși simulărilor MD a fost renumit pe baza potențialului toxic și a energiei libere medii de legare pentru a obține setul final de compuși. Au fost luați în considerare compușii cu o energie de legare MM/GBSA mai mică de -55,0 kcal/mol și un potențial toxic mai mic de 0,5.
Finanțare
Nu s-a obținut nicio finanțare externă pentru acest studiu.
Recunoaștere
Autorii mulțumesc cu recunoștință pentru sprijinul acordat de NVIDIA Corporation prin donația a GPU-ului Titan Xp utilizat pentru această cercetare.
Informații de sprijin disponibile
Informații complete despre toți cei 55 de compuși supuși simulărilor MD, precum și informații despre pozițiile de legare, proprietățile farmacocinetice și legăturile de hidrogen pentru selecția finală a compușilor sunt disponibile într-un document PDF separat Supporting Information.
Referințe
(1) Chen, N.; Zhou, M.; Dong, X.; Qu, J.; Gong, F.; Han, Y.; Qiu, Y.; Wang, J.; Liu, Y.;
Wei, Y.; Xia, J.; Xia, J.; Yu, T.; Zhang, X.; Zhang, L. Caracteristici epidemiologice și clinice ale celor 99 de cazuri de pneumonie cu noul coronavirus 2019 în Wuhan, China: un studiu descriptiv. The Lancet 2020, 395, 507{513.
(2) Zhou, P. et al. Un focar de pneumonie asociat cu un nou coronavirus de origine probabilă de liliac. Nature 2020,
(3) Organizația Mondială a Sănătății, Rapoarte privind situația noilor coronavirus (2019-nCoV).
https://www.who.int/emergencies/….
(4) Wang, F.; Chen, C.; Tan, W.; Yang, K.; Yang, H. Structura proteazei principale din Coronavirusul uman NL63: Insights for Wide Spectrum Anti-Coronavirus Drug Design.
Scientic Reports 2016, 6, 22677.
(5) Chen, Z.-M. et al. Recomandări de diagnostic și tratament pentru infecția respiratorie pediatrică cauzată de noul coronavirus 2019. Jurnalul mondial de pediatrie : WJP, 2020,
(6) Wu, F. et al. Un nou coronavirus asociat cu boli respiratorii umane în China.
Nature 2020,
(7) Organizația Mondială a Sănătății, Comitetul pentru situații de urgență din cadrul Regulamentului sanitar internațional privind noul coronavirus din China. https://www.who.int/news-room/events/detail/2020/01/30/default-calendar/international-health-regulations-emergency-committee-on-novel-coronavirus-in-china.
(8) Stoermer, M. J. Homology Models of the Papain-Like Protease PLpro from Coronavirus
2019-nCoV. 2020,
(9) Keogh-Brown, M. R.; Smith, R. D. The economic impact of SARS: Cum se potrivește realitatea cu previziunile? Politica în domeniul sănătății 2008, 88, 110-120.
(10) Zhijian Xu, Y. S. Z. Z. Z. K. M. M. X. W. W. Z., Cheng Peng Nelnavir a fost prezis a fi un inhibitor potențial al proteazei principale 2019-nCov printr-o abordare integratoare care combină modelarea homologică, docking-ul molecular și calculul energiei libere de legare.
2020, 1201, 1-20.
(11) Zumla, A.; Hui, D. S.; Azhar, E. I.; Memish, Z. A.; Maeurer, M. Reducerea mortalității cauzate de 2019-nCoV: terapiile orientate spre gazdă ar trebui să fie o opțiune.
The Lancet 2020, 395, e35-e36.
(12) Zhang, H.; Saravanan, K. M.; Yang, Y.; Hossain, T. Screening de medicamente bazat pe învățare profundă pentru noul coronavirus 2019-nCov. 2020, 19, 1-17.
(13) Yang, S. et al. Synthesis, Crystal Structure, Structure-Activity Relationships, and Antiviral Activity of a Potent SARS Coronavirus 3CL Protease Inhibitor.
Journal of Medicinal Chemistry 2006, 49, 4971-4980.
(14) Ghosh, A. K.; Osswald, H. L.; Prato, G. Recent Progress in the Development of HIV-1 Protease Inhibitors for the Treatment of HIV/AIDS.
Journal of Medicinal Chemistry 2016, 59, 5172-5208.
(15) Liu, X.; Wang, X.-J. Potențiali inhibitori împotriva proteazei M a coronavirusului 2019-nCoV din medicamente aprobate clinic.
Journal of Genetics and Genomics 2020,
(16) Liu, Z.-B. J. Z. Z. Y. Y. H. R. Z., X. Structura cristalină a proteazei principale COVID-19 în complex cu un inhibitor N3. http://www.rcsb.org/structure/6LU7.
(17) Li, Y.; Zhang, J.; Wang, N.; Li, H.; Shi, Y.; Guo, G.; Liu, K.; Zeng, H.; Zou, Q. Ther
apeutic Drugs Targeting 2019-nCoV Main Protease by High-Throughput Screening.
bioRxiv 2020, 2020.01.28.922922.
(18) Pillaiyar, T.; Manickam, M.; Namasivayam, V.; Hayashi, Y.; Jung, S. H. An overview of severe acute respiratory syndrome-coronavirus (SARS-CoV) 3CL protease inhibitors: Peptidomimetice și chimioterapie cu molecule mici.
Journal of Medicinal Chemistry 2016, 59, 6595-6628.
(19) Raugi, D. N.; Smith, R. A.; Gottlieb, G. S. Patru modificări de aminoacizi în proteaza HIV-2 conferă sensibilitate la nivel de clasă la inhibitorii de protează. Journal of Virology 2016, 90, 1062-1069.
(20) Chen, Y. W.; Yiu, C.-p.; Wong, K.-y. Predicția structurii 2019-nCoV 3C-like protează (3CLpro) Structura screening-ului virtual dezvăluie velpatasvir, ledipasvir și alți candidați de reprofilare a medicamentelor. pdf.crdownload. 2020,
(21) Vedani, A.; Dobler, M.; Hu, Z.; Smiesko, M. OpenVirtualToxLab – O platformă pentru generarea și schimbul de date de toxicitate in silico.
Toxicology Letters 2015, 232, 519-532.
(22) Gao, K.; Nguyen, D. D.; Wang, R.; Wei, G.-W. Machine intelligence design of 2019-nCoV drugs. bioRxiv 2020, 2020.01.30.927889.
(23) Lionta, E.; Spyrou, G.; Vassilatis, D.; Cournia, Z. Structure-Based Virtual Screening for Drug Discovery: Principles, Applications and Recent Advances (Principii, aplicații și progrese recente). Current Topics in Medicinal Chemistry 2014, 14, 1923-1938.
(24) Recio, C.; Maione, F.; Iqbal, A. J.; Mascolo, N.; De Feo, V. The potential therapeutic application of peptides and peptidomimetics in cardiovascular disease.
Frontiers in Pharmacology 2017, 7, 1-11.
(25) Waring, M. J.; Arrowsmith, J.; Leach, A. R.; Leeson, P. D.; Mandrell, S.; Owen, R. M.; Pairaudeau, G.; Pennie, W. D.; Pickett, S. D.; Wang, J.; Wallace, O.; Weir, A. An.
analiză a uzurii candidaților la medicamente de la patru mari companii farmaceutice.
Nature Reviews Drug Discovery 2015, 14, 475-486.
(26) Walters, W. P. Mergând mai departe decât regula lui Lipinski în proiectarea medicamentelor.
Expert Opinion on Drug Discovery 2012, 7, 99-107.
(27) Nguyen, T. T. H.; Woo, H. J.; Kang, H. K.; Nguyen, V. D.; Kim, Y. M.; Kim, D. W..;
Ahn, S. A.; Xia, Y.; Kim, D. Inhibarea mediată de flavonoide a coronavirusului 3C-
exprimată în Pichia pastoris.
Biotechnology Letters 2012, 34, 831-838.
(28) Galochkina, A. V.; Anikin, V. B.; Babkin, V. A.; Ostrouhova, L. A.; Zarubaev, V. V. V.
Activitatea de inhibare virală a dihidroquercetinei, un flavonoid din Larix sibirica, împotriva coxsackievirusului B4 într-un model de pancreatită virală. Archives of Virology 2016, 161, 929-938.
(29) Wade, R. C.; Goodford, P. J. The role of hydrogen-bonds in drug binding. Progrese în cercetarea clinică și biologică 1989, 289, 433-444.
(30) Hui, D. S.; I Azhar, E.; Madani, T. A.; Ntoumi, F.; Kock, R.; Dar, O.; Ippolito, G.;
Mchugh, T. D.; Memish, Z. A.; Drosten, C.; Zumla, A.; Petersen, E. Amenințarea epidemică continuă 2019-nCoV a noilor coronavirusuri pentru sănătatea globală | Cel mai recent focar de nou coronavirus 2019 în Wuhan, China. Jurnalul internațional de boli infecțioase 2020, 91, 264-266.
(31) Schrodinger LCC, Maestro Small-Molecular Drug Discovery Suite 2019-4. 2019,
(32) Okonechnikov, K.; Golosova, O.; Fursov, M.; Varlamov, A.; Vaskin, Y.; Efremov, I.; German Grehov, O. G.; Kandrov, D.; Rasputin, K.; Syabro, M.; Tleukenov, T. Unipro
UGENE: Un set de instrumente bioinformatice nemodificate. Bioinformatics 2012, 28, 1166-1167.
(33) Thompson, J. D.; Higgins, D. G.; Gibson, T. J. CLUSTAL W: Îmbunătățirea sensibilității alinierii progresive a secvențelor multiple prin intermediul ponderării secvențelor, al penalizărilor de decalaj specifice poziției și al alegerii matricei de ponderare.
Nucleic Acids Research 1994, 22, 4673-4680.
(34) Bowers, K.; Chow, E.; Xu, H.; Dror, R.; Eastwood, M.; Gregersen, B.; Klepeis, J.;
Kolossvary, I.; Moraes, M.; Sacerdoti, F.; Salmon, J.; Shan, Y.; Shaw, D. Scalable Algorithms for Molecular Dynamics Simulations on Commodity Clusters. Conferința ACM/IEEE SC 2006 (SC’06) 2006, 43.
(35) Shaw, D. E. et al. Anton 2: Raising the Bar for Performance and Programmability in a Special-Purpose Molecular Dynamics Supercomputer. Conferința internațională pentru calcul de înaltă performanță, rețele, stocare și analiză, SC 2014, 2015-Janua, 41-53.
(36) ChemAxon, Marvin (v.20.4.0). 2020.
(37) Bhal, S. K.; Kassam, K.; Peirson, I. G.; Pearl, G. M. The rule of ve revisited: Aplicarea log D în loc de log P în filtrele de asemănare a medicamentelor. Molecular Pharmaceutics 2007, 4, 556-560.
(38) Sterling, T.; Irwin, J. J. ZINC 15 – Descoperirea de liganzi pentru toată lumea. Revista de informații și modelare chimică 2015, 55, 2324{2337.
(39) Kim, S.; Chen, J.; Cheng, T.; Gindulyte, A.; He, J.; He, S.; Li, Q.; Shoemaker, B. A.;
Thiessen, P. A.; Yu, B.; Zaslavsky, L.; Zhang, J.; Bolton, E. E. PubChem 2019 update:
acces îmbunătățit la datele chimice. Cercetarea acizilor nucleici 2019, 47, D1102{D1109.
(40) Koes, D. R.; Baumgartner, M. P.; Camacho, C. J. Lecții învățate în notarea empirică cu smina din exercițiul de analiză comparativă CSAR 2011.
Revista de informații și modelare chimică 2013, 53, 1893{1904.
(41) Brooks, B. R. et al. AutoDock Vina: Îmbunătățirea vitezei și preciziei de andocare cu o nouă funcție de scorare, optimizare eficientă și multithreading. Revista de chimie computațională 2009, 30, 1545-1614.
(42) Morris, G.; Huey, R. AutoDock4 și AutoDockTools4: Andocare automatizată cu flexibilitate selectivă a receptorilor. J Comput Chem. 2009, 30, 2785-2791.
(43) Halgren, T. A.; Murphy, R. B.; Friesner, R. A.; Beard, H. S.; Frye, L. L.; Pollard, W. T.; Banks, J. L. Glide: O nouă abordare pentru andocare și notare rapidă și precisă. 2.
Factori de îmbogățire în screeningul bazelor de date. Journal of Medicinal Chemistry 2004, 47, 1750-1759.
(44) Vedani, A.; Dobler, M.; Smiesko, M. VirtualToxLab – O platforma pentru estimarea potențialului toxic al medicamentelor, substanțelor chimice și produselor naturale. Toxicologie și farmacologie aplicată 2012, 261, 142-153.